◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
另类眼观从搜索引擎工作原理去研究SEO
在做SEO的过程中你是否有以下困惑?
1、为什么百度蜘蛛天天爬行,可是快照还没更新?
2、为什么网站快照更新了,排名没有变化?
3、为什么排名变化了,快照还没更新?
4、为什么要优化tiltle、优化meta标签、使用h1-h6,为什么要增加密度?
搜索引擎系统是由4个子系统组成:网页抓取子系统、内容索引子系统、链接结构子系统和信息查询子系统。这4个子系统独立工作,也会相互结合进行工作。
网页抓取子系统核心成员就是我们常讲的“蜘蛛”或“爬虫”,这个“蜘蛛”每天的任务就是搜集网页,抓取后初期会反复爬行这个网页,判断这个网页或站点的更 新周期,以方便下次爬行。然后对网页进行“去伪存真”。然后将整理过的“网页”交给内容索引子系统,由内容索引子系统对这些网页“分门别类”,存储到索引 库中,然后对网页内容进行“去噪处理”,给予一个原始的质量分。
至于这个“质量分”就跟该网页所在索引库的“索引词”有关,相关度越高,质量分越高。相关度就我们常讲的“title、meta、h1-h6”有关了,从 搜索引擎的角度来讲这个叫“用户体验”。这里的质量分评定为相加的关系,比如:title与索引词的相关度为0.1,meta的用户体验度为0.05,索 引词的上下文环境为0.01,最终这个页面的质量分为:0.16
然后经过链接结构子系统对网页的链接进行分析,包括分析这个页面导出链接数,同二级域名下的指向这个页面的链接,同域名下指向这个页面的链接,外部域名下指向这个页面的链接,各个链接页面的质量。最终给予这个页面的一个质量分,这里也是相加的关系。
最后用户在使用“关键词”进行查询的时候,信息查询子系统首先会对用户使用的“关键词”进行拆分,查找相匹配的索引词,提取索引库存储的网页。然后用内容索引的质量分 * 链接结构的质量分,再参考大部分用户的点击习惯,返回一个“用户体验度”最高的查询结果。
说到这里,我想大家应该可以明白 前面提出的4个问题了吧?因为是不同的搜索引擎子系统在工作,所以才会出现上面的情况。如果有不明白的欢迎提问,我再详细解答
搜索引擎是海量数据的集合,SEO也是需要靠数据说话。做SEO不研究搜索引擎,每天纠结在一些很表面的元素上,我觉得事件很偏离本质的事情。
当然我上面这些看法纯属个人理解,也可能存在很多理解偏差的地方,希望大家多多讨论。
文章来源:http://www.seohn.cn/seo/serp-yuanli-seo/
转载请著名版权:湖南SEO 浏览更多SEO知识,关注seo随笔 seo案例 HTML地图
版权所有。转载时必须以链接形式注明作者海军和原始出处及本声明。
