搜索词处理(中文分词、去停止词、指令处理、拼写错误矫正、整合搜索出发、搜索框提示))、文件匹配、初始子集选择、相关性计算((关键词常用程度、词频及密度、关键词位置及形式、关键词距离、链接分析及页面权重)、排名过滤和调整、排名显示、搜索缓存、查询及点击日志(搜索用户的IP地址、搜索的查询词、搜索时间,以及点击了哪些结果页面,搜索引擎都记录形成日志)。
以下继续分析网络营销搜索引擎的工作原理。
百度搜索引擎必须通必经的四个过程:
百度搜索引擎必经的四个过程依次为:抓取、过滤、建立索引和输出结果。
抓取:Baiduspider或百度蜘蛛将确定要抓取的网站以及通过搜索引擎系统的计算来抓取的内容和频率值。
过滤:互联网中并非所有的网页都对用户有意义,例如一些明显的欺骗用户的网页,死链接,空白内容页面等等。百度会自动过滤此内容。
建立索引:百度将逐个标记和识别被抓取的内容,并将这些标记存储为结构化数据。同时,将识别并存储网页中的关键词信息以供用户搜索,以便与用户搜索的内容进行匹配。
输出结果:用户输入的关键词,百度将进行一系列复杂的分析,并根据分析结论,根据关键词所反映的需求,找到一系列与索引库中最匹配的网页。按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户
通过上面的介绍,我认为每个人都已经了解了搜索引擎的工作原理。还是那句话,一般的SEO人员仅需理解即可,如果你想深入了解搜索引擎,你应该去看一本关于搜索引擎信息检索的书,或者更广泛的信息检索书。
上一篇:网络营销搜索引擎工作原理
下一篇:单页面网站优化技巧总结