今天下午6:30左右网站访问速度突然缓慢,严重时连HTML纯文档也无法加载访问。刚开始怀疑是Z-Blog v1.8程序本身问题,新版可能没有作全面测试,或多或少存在着问题。询问几位使用新版Z-Blog的网友没人遇到我的情况。BLOG是12月25日晚上全部升级完成,如果程序有问题,应该当天就出现目前的情况,可当天的访问速度非常快,没有任何异常。基于上面情况分析判断不是Z-Blog程序本身问题。晚上联系IDC技术部,机房测试结果:5秒左右可以正常加载首页,他们怀疑是我自己的网络问题(2M ADSL),可我访问别的网站很顺畅,主页平均PING值17ms-54ms也完全正常。几经测试没有找到问题根源,后因有事出门就没有继续关注这事情,初步怀疑服务器问题。
晚上更新主页时发现昨天的问题没有完全处理好,网速确实是快了一点,时快时慢似的,整体速度还是很缓慢,首页加载时间约20秒左右,而后台ASP程序基本没办法使用。检查whois时意外发现“Reverse IP: 268 other siteshosted on this server.”(共268个虚拟主机在这服务器,其中一个是俺的,数量不少,狂汗~~~),同时查出这台服务器其他虚拟主机的域名,结果其他的虚拟主机的首页访问速度非快,是俺空间网速的N倍。当时有点迷惑和生气,我购买的虚拟主机也是企业级的,相同服务器的虚拟主机访问速度竟然差天隔,感觉有点给骗的感觉。马上给IDC技术部门联系,他们初步断定为带宽和同时连接数受到了限制,配合技术人员数次的监控测试,最终结论为:流量和最大连接数制约着您网站的发展,提出解决方案是:请尽快升级主机!当场吐血……
俺的BLOG一直没有公开,重来做过任何的拉人气宣传。刚开始建BLOG时主要目的是记录饲养宠物情况和一些日常兴趣日记,除了几位较熟悉的鱼友应该没多少人知道BLOG网站的存在。baidu、google、yahoo等搜索引擎每天带来最大的独立IP只有48人,平时一般是20IP/日左右,从理论上网站不可能有较大的流量和IIS(同时连接数)。要求IDC技术人员提供流量数据和IIS的连接情况,结果婉转拒绝。难道是IDC骗俺续费两年后就把虚拟主机的原有网络资源给砍掉了?这家IDC俺2005年就开始租用,空间一直保持快速和稳定,不像一位奸商的作风。过去在别的奸商IDC租用的虚拟主机,十个九个手段是在配置暴差的服务器挂上上千个虚拟主机的,主页无法访问是兵家常饭的事情,只挂268个虚拟主机已经算很“信誉”了!忙碌大半天仍然一头雾水。
怀着半信半疑进入虚拟主机的控制台,无意发现,俺这个月的数据流量5GB有多!俺的空间最大的网络数据就只有图片而且文件不大,平均每天20IP左右的访问量不可能占用5G的数据流量。登陆FTP服务器,将部分upload的图片目录改名,其中有一个MP3目录怎么也改不掉,这时才恍然大悟:肯定是MP3目录里面的.mp3文件正在进行访问,新的MP3插件没出主页网友基本听不到音乐,俺又没在线音乐,可见是其他外网进行访问的操作!立即下载并查看主机的流量日志时让我哭笑不得,基本每天都有N多的人未经允许在我的空间大容量下载MP3文件(俺的MP3没有低于5MB的,最大的达20MB),9月10号竟然有一份14MB的流量记录而且基本都是MP3下载的流量记录!问题终算找出,在控制台把WEB浏览关闭,将MP3目录删除,十分钟后浏览主页访问速度基本恢复正常。
俺的空间非公开,那些人是如何知道本站MP3的具体地址呢?带着疑问分析日志发现一个比较特殊的规律:所有曾经下载过的MP3的文件名都是具备歌曲或歌手名字的,如陈奕迅-爱情转移.mp3、love.mp3、一厢情愿.mp3,而里面有一首1.mp3(以前上传后忘记改名,其实是光良童话的歌曲)的MP3就没有任何的下载记录。日志已经告诉我答案,全是盗链的恶作,而幕后最大的控制者就是类似mp3.baidu.com的MP3搜索网站(技术原因,没能力找出具体是哪个“中转网站”收集本站MP3资源,因为俺看到的只有实际者的下载IP)!这种“中转网站”其实就类似baidu、google搜索引擎,每隔一段时间就派出“蜘蛛”程序对一定IP范围内的互联网站进行检索,一旦发现新的网站或网站的资源变更,它会自动提取网站的信息和网址加入自己的数据库,发布后提供网民的搜索服务。俺的MP3目录非常不幸运,给“蜘蛛”瞄上导致这次闹剧。把MP3文件名改为杂而无序的名字有助防止“蜘蛛”的抓取机率,因为它不会对这种乱七八糟的名字感兴趣,更不知道这种MP3到底什么样的歌曲自然不会录取(蜘蛛要是能听懂MP3内容是非常可怕的)。这种方法不适合HTML网页,一言难尽就不再一一解说,其实绝大多数的站长都非常希望自己的网站给各大搜索引擎收录而带来流量(通常指.htm或.html的网页,非不是.mp3、exe、.rar、.zip等),甚至为了被众多搜索引擎更多地收录网站网页而深入学习研究SEO优化,又扯远了-_-#
折磨俺足足大半天,强烈鄙视无耻的盗链行为!!!
2008.1.21纠正两个错误观点:
1、“把MP3文件名改为杂而我序的名字有助防止蜘蛛的抓取机率”观点是错误的。经过阅读相关文章大概明白音乐搜索引擎并不只是采集MP3文件名,它是通过匹配MP3文件的歌曲、歌手和歌词等相关内容进行智能采集。和网页引擎原理一样,蜘蛛不需要知道HTML文档名字规律,只要能够进行采集和分析文档相关内容即可完成抓取。
据最新的音乐引擎资料显示“用音乐搜索音乐”已经可以通过语音对音乐本质进行智能的匹配、分析并返回相关结果。自己对着电脑的麦克风哼一小段甚至是直接用键盘弹几下就能找到想要的歌曲。下面是就这类不可思议的音乐搜索引擎网站:
Midomi
SongTapper
TuneSpotting
ThemeFinder
Musipedia
