SEO从业者必须了解的搜索引擎工作原理|青岛网站优化|青岛网站推广|青岛网络营销|青岛SEO|鑫宇科技

　　图2，蜘蛛在整个互联网上爬行遇见你网站的一个URL，首先把URL提取出来根据网站权重和相关性插入到URL队列中，然后是判断你网站的这条URL是否能够解析成功，如果能解析成功，蜘蛛会爬到你网站，这里需要说一下，蜘蛛并不是直接去分析你网页的内容，而是去寻找你网站robots文件，根据你网站的robots规则判断是否抓取你这个页面，如果robots文件不存在，则会返回一个404错误，但是搜索引擎已经会继续抓取你的网站内容。

　　搜索引擎抓取了网页内容之后会对网页进行一个简单的判断是否达到了收录标准，如果不符合则继续把URL加入到URL 队列中，如果符合收录就会下载网页内容。

　　当搜索引擎拿到下载网页内容的时候，会提取出页面上的URL，继续插入到URL队列中，然后把页面上的数据，进行进一步分析，判断网页内容是否达到收录标准，如果达到收录标准则把页面存储到硬盘中。

　　当用户搜索某个关键词时，搜索引擎为了减少查询时间，将一部分相关性比较高的内容放到临时缓存区，大家都知道从计算机的缓存中读取数据，比在硬盘中读取数据快很多。所以搜索引擎只将缓存中的一部分显示给用户。被存储在硬盘中的页面，搜索引擎会根据网站权重定时对其进判断是否有更新，是否达到了放入缓存区的标准，如果搜索引擎在判断是否有更新的同时发现网站页面被删除或网页达不到被收录的标准也会被删除。

　　以上就是搜索引擎的组成和页面收录原理，希望每一位seo人员都应掌握。

上一篇：Seo数据分析必须要注意的几大要素
下一篇：如何看待并颠覆百度传统外部优化误区

共有条评论信息评论信息

栏目分类

信息排行