如何正确使用robots.txt文件?

访客4年前黑客文章987

当您网站在进行SEO优化工作时,robots.txt文件是一个功能强大的工具,但应谨慎对待。它可以允许或拒绝搜索引擎访问不同的文件和文件夹,我们应该如何正确使用robots.txt文件?

如何正确使用robots.txt文件?

搜索引擎不断改进爬行方式和算法,这意味着几年前的更佳做法不再起作用,甚至可能损害您的网站。

如今,更佳做法意味着尽可能少地依赖robots.txt文件。实际上,只有在您遇到复杂的技术难题或没有其他选择时,才真正需要阻止robots.txt文件中的URL。

对于大多数网站,以下示例是更佳做法:

  1. User-agent:*
  2. Allow:/

我们甚至在自己的robots.txt文件中使用此 *** 。

该代码的作用是什么?

该User-agent: *说明指出,以下任何说明都适用于所有的搜索引擎。

因为我们没有提供任何进一步的说明,所以我们说“所有爬网程序都可以不受限制地自由爬行该网站”。

如果您想防止搜索引擎对WordPress网站的某些部分进行爬网或编制索引,通常更好通过添加meta robots标签或robots HTTP标头来做到这一点。

在搜索结果的可见性之前,搜索引擎需要发现、爬网和索引页面。如果您已通过robots.txt阻止了某些URL,则搜索引擎将无法再通过这些页面来发现其他页面。这可能意味着关键页面不会被发现。

Robots.txt拒绝链接值

SEO的基本规则之一是来自其他页面的链接会影响您的性能。如果某个URL被阻止,不仅搜索引擎不会对其进行爬网,而且它们也可能不会将指向该URL的任何“链接值”或通过该URL分发给网站上的其他页面。

Google全面呈现您的网站

人们过去常常阻止对CSS和JavaScript文件的访问,以使搜索引擎专注于那些最重要的内容页面。

如今,Google会获取您所有的样式和JavaScript,并完全呈现您的页面。了解页面的布局和表示形式是评估质量的关键部分。因此,当您拒绝Google 访问CSS或JavaScript文件时,Google根本不喜欢它。

您(通常)不需要链接到您的站点地图

robots.txt标准支持将指向您的XML网站地图的链接添加到该文件。这有助于搜索引擎发现站点的位置和内容。

我们一直觉得这是多余的。您应该已经通过将站点地图添加到 Google Search Console和Bing网站管理员工具 帐户中来访问分析和效果数据。如果这样做,则在robots.txt文件中不需要引用。

相关文章

科索沃前“总统”将受拱手礼审 英媒:可能带来政治上

  科索沃前“总统”将在荷兰受审,英媒:可能给该地区带来政治上的不稳定   【环球时报记者 张旺】科索沃地区前领导人萨奇5日被押往荷兰海牙。因被指控犯下战争罪,萨奇已经被移交给当地拘留中心。   ...

营销策略怎么写?市场营销战略该如何写

营销策略怎么写?市场营销战略该如何写

凡是接触过市场的朋友,应该都大致听过以下的几个词汇,譬如:市场细分、目标市场、市场定位等,其实它们都隶属于STP战略,被广泛应用于市场营销过程中。 营销战略 STP战略主要分为三个步骤 一、...

【知乎】看看知乎网的大师们最喜欢哪个nv忧?

知乎上的大师们回覆的专业性和权威性都异常强, 只要你有问题,就会有大师来回覆, 今天看见了一个问题“你最喜欢哪个诶威nv忧?为什么?” 不少大师都回覆了自己喜欢的nv忧、fanhao和图片,...

牟长青、A5图王、乔帮主、卢松松干货合集

很荣幸有机会参加到逆袭会的交流会中,来的大牛非常多,名字我就就不一一介绍了,听到很多大牛的分享,我把笔记记下来,供给那些没有看到的人。 牟长青微信推广运营 牟长青是28推的创始人,也是我学习SEO...

黑客技术word试题原文,去哪里找网络黑客,黑客服务在哪找

[1][2][3][4]黑客接单渠道笔者小学文化,言语安排能力差,写的不通的地方请咱们将就着看,不喜勿喷。 3 假如自动使用或许导致安全问题,能够进犯终端用户也能够进犯后端内容提供者,比如某一个isp...

webQQ将于2019年1月1号停服,属于90后的回忆又少了

守候许多 小伙伴们长大了的QQ宠物在2020年6月份停止运营了,还没有从每日登QQ已不有企鹅的情况中缓回来,腾讯又公布了一则信息,WebQQ将于2019年1月1日日终止服务项目,登陆WebQQ,除开登...