毫不夸张的说现在电子商务网站上的信息,注册机发布的占绝大多数,注册机群发来的信息就是改数据库结构,加N个验证码也不阻止不了。其实弄清楚注册机发信息的原理就能轻松搞定了。注册机不会直接提交进去数据库,主要还是要通过表单post到的页面来提交,注册机注册和发布信息,速度很快,我们可以在注册机的提交页面上验证来路,不是那个来路就跳转开,上一个页面再验证上一个页面的来路。各个来路跳转的时间要判断好,如果在几毫秒就离开的,就识别为注册机注册。发布信息也是一样的,先判断入口,如果不是通过登陆口页面登陆的,就识别为注册机,提示禁止外部提交。
其实对于注册机发的信息,我的看法是可以有条件的、有方式的接收,只要是访客有可能关注的合法信息都可以让它进来网站里面,网站靠什么做大,不就是信息量嘛。首先用程序审核关键词,带有非法关键词的直接提交不进去,其次对发来的信息的格式用函数进行统一处理(1是可以美观,免得乱七八糟什么特殊符号都有;2是最关键的可以达到伪静态的效果),通过上述方法处理的信息,不用担心被搜索引擎K或者其他惩罚后果,我运营的一个站就有是这样处理的,云南商机网(www.ynshangji.com)所有信息程序判断再进行伪静态处理,现在40万的信息,百度收录了19.3万,数字还在不断增加中,信息都是合法信息。相比其他同类B2B网站的用大量资讯类信息来提高收录量,我觉得这个办法也不能说是个坏方法。
当然更多的东西需要在实践中慢慢摸索了,总之变废为宝或者直接当垃圾处理就看自己的想法了。
云南电子商务研究站(http://www.xiongmaotou.com)原创文章转载请注明原文出处,谢谢