当前位置:沐风博客 / SEO问答 / 正文

搜索引擎蜘蛛抓取页面的依据是什么

发布时间:2023年05月19日 07:36:33 | 责任编辑 : 沐风 | 分类 : SEO问答 | 浏览: 1073次 | 评论 0

问题:搜索引擎蜘蛛抓取页面的依据是什么?

回答:核心思想是信任度,搜索引擎对站点的信任度越高,抓取就会越频繁,当然这个信任度涉及到很多因素!

大家有没有发现,那些蜘蛛抓取频次很低的站点,通常都是权重很低的,或者是新上线的站点。这些站点没有得到搜索引擎足够的信任,搜索引擎在具体的抓取策略上就会更加慎重,不会贸然增加抓取次数!

注意:这个抓取频次是相对的!比如说沐风博客,百度每天的抓取频次就不多,也就是600左右,偶尔会涨到1000左右,但总体不高。另外有个站点的预估权重不高,但这个站点有几万个页面被收录,所以它的百度抓取频次就高些,有4000左右。

关于蜘蛛抓取页面的流程问题,沐风SEO在很多文章里面都有讲过,但很多人还是不知道!比如有朋友认为,搜索引擎蜘蛛是顺着页面上的链接逐个去抓取的,他们认为只要蜘蛛来抓取了站点某个页面,那就应该是顺着这个页面上的链接,把站点的页面都抓取完!

很明显,这种说法是不对的,如果这种说法成立,我们还需要担心抓取频次很低吗?

正确逻辑应该是这样:蜘蛛从待抓取链接库(这个数据库怎么来的,有很多不同的策略,比如说通过备案系统,比如说通过站点主动提交的链接等等)出发,去抓取页面,然后提取这个页面上的内容,把链接加到待抓取链接库,本次抓取的工作就完成了!

至于更多其它页面的抓取,搜索引擎会根据策略,选择待抓取链接库的链接,再去爬行抓取。要注意,并不是蜘蛛来到站点以后就不走了,蜘蛛抓取是个循环的过程,同个IP蜘蛛不会呆在某个站点不走。

知道搜索引擎蜘蛛抓取页面的依据是信任度以后,如何有效提升抓取频次呢?

核心思路还是持续更新高质量的内容,把站点的权重提上来,这样就能有效提升信任度。网站的权重高了,站内的页面数量多了,抓取频次自然就会水涨船高!

最近在很多地方看有朋友反应,说自己的站点采集了很多内容,导致蜘蛛都不来抓取了。这个问题沐风SEO并没有去测试,但想来有道理,采集了太多的垃圾内容,会降低搜索引擎对站点的信任度,减少抓取在情理之中。

之前的情况是这样:搜索引擎会优先抓取那些更新频率高、更新量大的站点,就算站点的内容是采集的,搜索引擎还是会给予很多的抓取频次。但搜索引擎的机制在持续完善,更新换代抓取策略也是必然的。所以说,如果你的采集站抓取频次很低,那也属于正常情况。

总之而言,我们不需要去考虑搜索引擎抓取和收录页面的依据具体是啥,只要记住一点,那就是搜索引擎更喜欢抓取和收录优质内容。所以,我们在日常的SEO工作中,要持续更新高质量内容,从根本上解决蜘蛛抓取频次的问题。


本站内容大部分由沐风博客原创,少部分内容来源于网络,如有侵权请与我们联系,我们会及时删除!

扩展阅读