robots.txt怎么写?(分享robots.txt文件编写规则)

访客3年前黑客工具371

robots.txt文件编写规则】

不论我们SEO站长用什么建站程序,都应该了解掌握robots文件的编写规则和格式,那么robots文件的格式规则是怎样的呢?

1、User-agent:该项的值用于描述搜索引擎robot的名字。

例子:User-agent:Baiduspider ,指的就是百度搜索引擎蜘蛛。

2、Disallow:该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀,以Disallow项的值开头的URL不会被 robot访问。

例子1:Disallow: /wp-admin/,指的是不允许访问wp-admin文件夹下面的内容,但是不限制访问wp-admin.php、wp-admin.html文件。例子2:Disallow: /wp-admin,指的是不允许访问wp-admin文件夹下面的内容以及wp-admin.php、wp-admin.html文件。

3、Allow:该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL 是允许robot访问的。

例子:Allow: /wp-content/uploads/,指的是允许访问wp-content文件夹下面的uploads文件夹的内容。

4、使用”*”和”$”:Baiduspider支持使用通配符”*”和”$”来模糊匹配url。 “*” 匹配0或多个任意字符 “$” 匹配行结束符。

例子1:User-agent:*,指的是所有搜索引擎蜘蛛(或机器人)。例子2:Disallow: /*.css$,指的是不允许访问任何后缀为.css文件。

5、Sitemap:用来告诉搜索引擎网站地图的位置。

例子:Sitemap: https://你的域名/sitemap.xml,其中sitemap.xml是你的网站的网站地图文件

编写注意事项:

①百度会严格遵守robots的相关协议,请注意区分您不想被抓取或收录的目录的大小写;

②百度会对robots中所写的文件和您不想被抓取和收录的目录做精确匹配,否则robots协议无法生效。

③一定是英文输入法格式下的“空格”和符号,因为代码是英文格式的

【wordpress的robots怎么写更佳】

1、我们当然希望所有的搜索引擎都来抓取网站。因此,我们可以写

User-agent:*

2、为了避免收录WordPress系统文件,因为系统文件对于用户来说没用处,收录了反而容易被人黑站,因此应该屏蔽了WordPress的后台文件。

Disallow: /wp-admin/Disallow: /wp-includes/Disallow: /wp-content/

3、每个默认的文章页面代码里,都有一段trackback的链接,如果不屏蔽让蜘蛛去捉取,网站会出现重复页面内容问题。

Disallow: feedDisallow: /comments/feed

5、这个是屏蔽捉取站内搜索结果。站内没出现这些链接不代表站外没有,如果收录了会造成和TAG等页面的内容相近。

Disallow: /*?*Disallow: /?s=*Disallow: /*/?s=*\

6、屏蔽留言链接插件留下的变形留言链接。

Disallow: /?r=*

7、屏蔽捉取留言信息链接。一般不会收录到这样的链接,但为了更好地让蜘蛛高效抓取和工作,也该屏蔽。

Disallow: /*/comment-page-*Disallow: /*?replytocom*

8、网站地图地址指令,主流是txt和xml格式。告诉搜索引擎网站地图地址,方便搜索引擎捉取全站内容。另外要注意Sitemap的S要用大写,地图地址也要用绝对地址。

Sitemap: https://你的域名/sitemap.xml

综上所述,整个robots文件就是:

User-agent:*

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-content/

Disallow: feed

Disallow: /comments/feed

Disallow: /*?*

Disallow: /?s=*

Disallow: /*/?s=*\

Disallow: /?r=*

Disallow: /*/comment-page-*

Disallow: /*?replytocom*

Sitemap: https://你的域名/sitemap.xml

我们就可以利用robtos协议优化wordpress网站的被抓取和收录的速度,根据上面的robots文件内容,按照实际情况增加自己所需要的,希望能够帮助刚接触wordpress建站的站长更快上手。

相关文章

侃爷录音黑客(霉霉和侃爷录音)

侃爷录音黑客(霉霉和侃爷录音)

本文导读目录: 1、霉霉和侃爷怎么回事 2、霉霉和贾斯汀比伯谁红 3、多位名人政要推特被黑,这是怎么回事? 4、“金评霉”事件真相大白,霉霉被迫网暴四年,结局如何? 5、霉霉为什么称侃...

黑客之间的真实故事(黑客和小白的故事)

黑客之间的真实故事(黑客和小白的故事)

本文导读目录: 1、找一些著名黑客的故事! 2、世界上大名鼎鼎的黑客都做过哪些让人非常震惊的事情? 3、能不能提供几个关于黑客的传奇故事? 4、世界黑客名人都有什么故事 5、中国的黑客...

找黑客盗人号(中国黑客如何接单)

盗人号怎么找黑客 1、网上黑客警示他人,盗人号中国如何接单2006年3月10日。有时也需要强烈的跳出逻辑之外找黑客的直觉。bbb。黑客接单HTR漏洞查看源代码,也没什么大问题,你就知接单道是不是木马了...

巴人治灶串串香加盟流程,简化流程等待您的加入

巴人治灶串串香加盟流程,简化流程等待您的加入

现在的社会充满了铜臭味,但是大家就是喜欢这铜臭味,人们都想着拥有更多的财富,想着过上自己的理想中的生活,但是没有钱是寸步难行,所以大家都有了创业的念头,在众多行业中当然是选择餐饮行业的人最多了,因为餐...

冷敷贴的作用(哪一种冷敷贴可以敷来淡斑祛斑)

冷敷贴的作用(哪一种冷敷贴可以敷来淡斑祛斑) 医用冷敷贴就是最近比较火的医用面膜。医用面膜属于药妆范畴的一类面膜,也称医用护肤品。 医用冷敷贴之所以火,来自于这3个特点 1、无菌生产 医用...

如何可以查询到他人在酒店或宾馆的开房记录?其

自“CSDN”网络用户信息泄密事件发生后,大量京东商城用户信息泄露。昨天记者获悉,4名盗刷京东客户资金的嫌疑人已被海淀检察院批捕。   据了解,4人获取的京东商城客户数据,均来源于2011年年底CS...