◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
无意的强奸-搜狗
在前段时间SEO海军就写了一篇关于百度快照的文章,事情证明,百度的存档数据库是有的,之前的文章中是说了自己的一些经历,但是没有实际的案例,这里由于湖南SEO旗下站点,邵阳房产,由于程序的上传过滤不严,导致了整站被挂马.更可恨的是数据是ASP的,批量挂马的同时.也破坏了数据...当天晚上,海军就把程序全部删除掉,换上了一个单页面,,之前的站点百度是没有收录的,但是通过IIS日志就可以看出,百度蜘蛛访问过来了,而且抓取了很多页面的返回码为 200.不了解百度蜘蛛的请参考[百度蜘蛛爬行检测代码诠释] ,当时site时,无法收录,这时候SEO海军就麻木了.上次文章写到.频繁的换标题.换站,都是会被百度降权,甚至不会收录处理的,换上新的单页面后.居然被百度收录了,再次查看IIS日志,发现,虽然历史页面的路径已经不存在了.但是百度蜘蛛还是会频繁的过来访问,导致返回的错误是404,后来换了站,由于当时设置了404错误是返回首页的,这时候百度的蜘蛛继续访问历史的目录,得到的返回吗是200.正常.于是开始放出来SERP页面:

通过上面的时间可以确定.都是在删除站点的之前的时间,,
通过百度的快照,我们可以发现.历史的站点页面的快照.这个可以足以表现,百度的存档数据库是存在的.
貌似离题了.我们说的是强奸搜狗.别急嘛.说上面这些是为了后面的铺垫.
上面不是由于网站改版.发现日志返回是404 于是设置首页为404.这时候导航就出现了路径问题了.比如
原本的导航路径是xxx/1.asp 但是xxxx/xxxxx/xxxx/new.asp?id=123 404页面返回首页.这里造成了顶部导航的路径反馈问题.这时候导航路径就变成了
xxxx/xxxxx/xxxxx/xxx/1.asp这样又返回首页404继续导航链接的URL深入.
本身SEO海军也是没发现了.直到看到搜狗的蜘蛛过来访问如下:
2008-08-11 09:18:41 W3SVC949595160 59.57.14.30 GET /user/view/lpjiaoyi/news/lpjiaoyi/news/new.asp ArticleName=%BD%B9%B5%E3%B7%BF%CC%B8 80 - 220.181.61.225 Sogou+web+spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07) 200 0 3
2008-08-11 09:18:45 W3SVC949595160 59.57.14.30 GET /news/newshow.asp ArticleID=7871|25|80020009|- 80 - 202.160.178.129 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 500 0 0
2008-08-11 09:18:51 W3SVC949595160 59.57.14.30 GET /user/lpjiaoyi/news/news/news/jiaju.asp - 80 - 220.181.61.225 Sogou+web+spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07) 200 0 3
2008-08-11 09:19:01 W3SVC949595160 59.57.14.30 GET /user/news/news/lpjiaoyi/lpshow/news/new.asp ArticleName=%BD%B9%B5%E3%B7%BF%CC%B8 80 - 220.181.61.225 Sogou+web+spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07) 200 0 3
2008-08-11 09:19:11 W3SVC949595160 59.57.14.30 GET /user/view/lpjiaoyi/lpjiaoyi/news/lpjiaoyi/sub_buy.asp id=qg088794450 80 - 220.181.61.225 Sogou+web+spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07) 200 0 3
2008-08-11 09:19:21 W3SVC949595160 59.57.14.30 GET /user/lpjiaoyi/news/news/news/jiadian.asp - 80 - 220.181.61.225 Sogou+web+spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07) 200 0 3
看完了IIS日志.继续看下site抓图

相关页继续增加到3W.查看IIS日志得知.搜狗的蜘蛛还在继续抓. 这样做肯定是不好的,但是思路可以让我们联想到作弊.看到这样的情况SEO海军,赶紧HTML一个404页面.不能在继续这样虚拟页面出现了.至此,百度和谷歌,雅虎还没有出现这样的情况.
记得,几个月前,海军获取的一个流量作弊软件就是利用404错误进行虚拟页面的,后来试验站百度谷歌相继被K,当时没有查看搜狗,在搜索引擎这块,搜狗的能力还有待提高呀!
文章来源:http://www.seohn.cn/seo/qiangjian-sougou/
转载请著名版权:湖南SEO 浏览更多SEO知识,关注seo随笔 seo案例 HTML地图
版权所有。转载时必须以链接形式注明作者海军和原始出处及本声明。
