通过robots文件屏蔽搜索引擎，但还是被收录，什么原因？

如果网站一些页面不想被搜索引擎抓取和收录，我们会用到robots文件，里面设置搜索引擎的抓取规则。这种情况常用于新网站上线并处于测试阶段或者网站页面新增。

有些人可能会有疑问，搜索引擎蜘蛛爬行url页面，页面需要有内容呈现出来反馈给到蜘蛛，才有可能会被收录。那么，robots屏蔽搜索引擎后，为什么还是被收录？

先来说说robots协议到底是在做什么？既然是协议，那肯定是双方同意、认可的规矩。这个甲乙自然就是网站和搜索引擎（或者说搜索引擎蜘蛛）之间的协议。robots文件会放在根目录下，蜘蛛进入网站会第一时间访问这个文件，然后看看协议里面有没有禁止了那些页面不能抓取，如果禁止了就不会再去抓取。

个页面想要去搜索引擎索引（收录），收录要有蜘蛛爬行和抓取，既然不抓取，理所当然的就会被认为这个页面是不会被收录。这样的思维是错误的，不抓取也是可以被索引（收录）。如淘宝就是一个典型的案例，网站添加了禁止协议，最后还是被收录。原因在于，百度从其它渠道平台推荐的外部链接了解到这个网站，虽然被禁止抓取，但从标题和推荐链接的数据里还是可以判断出与该页面相应的内容信息。

好了，关于robots的知识分享就和大家说到这里。可能有些人还有疑问，比如说：robots既然不能够阻止页面被收录，有没有办法禁止索引（收录）呢？肯定是有的。至于如何禁止，使用操作方法如何看下百度关于robots文件的讲解：https://ziyuan.baidu.com/college/courseinfo?id=267&page=12#h2_article_title28

发布时间：2019-07-03

了解夫唯SEO特训营

夫唯学院成立于2007年，11年来与数万学员共成长。创始人夫唯先生总结的四处一词、站内站、定向锚文本、聚合等多种核心优化策略，并在众多学员网站上得到验证。夫唯先生推崇“循序渐进，基业长青”的SEO运维思想，以SEOWHY为现实实战案例，历经5年零起步创造了网站品牌。

SEO培训报名联系方式：客服QQ86594013 客服微信：seowhy2021

通过robots文件屏蔽搜索引擎，但还是被收录，什么原因？

了解夫唯SEO特训营

当前开班信息

联系我们

选择我们的理由

最新文章

学员分享

培训动态