robots文件的认知及了解robots文件的基本写法使用规则

访客4年前黑客文章359

robots文件一般在根目录下,每一条记录通过空行分开,在该文件中可以使用#进行注释,支持模糊匹配,该文件是区分大小写的但不严格,通常以一行或多行User-agent开始,后面加上若干Disallow和Allow。

Disallow:该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀。Allow:该项的值用于描述希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的前缀。

值得提醒的是每个搜索引擎都协议文件的解读不一样,比如百度是支持”*”和”$”来模糊匹配url的。”*”匹配0或多个任意字符,”$”匹配行结束符。最重要的是这个语法是从上到下生效的,切记。

常见的用法在网上可以找到,这里就这儿工具说几个不常见的,但是有用的东西,你们可以举一反三。

屏蔽所jpg或png图片被抓取:Disallow:/*.jpg$ 或者Disallow:/*.png$

禁止抓取所有动态页面:

User-agent:*

Disallow:/*?*

只允许抓取html网页:

Allow:/*.html$

User-agent:*

Disallow:/

禁止抓取后台所有文件同时隐藏后台真实目录:

#就这儿注释:比如你后台目录名是htdoadmin

Disallow:/*doad*

同时这个文件也支持放入网站地图地址:

#就这儿工具注释:一般放在整体结尾

Sitemap: http://XXX.com/sitemap.xml

最后面填个坑吧:上面说这个文件语法是从上到下生效,你或者不明白。就这儿在此举例说明:

#就这儿工具注释:仅允许 Baiduspider访问您的网站

User-agent: Baiduspider

Allow:/

User-agent:*

Disallow:/

前2行允许了百度爬行,那么第3-4行即使屏蔽了所有引擎包括百度,依然是允许百度爬行的。你明白了吗?再补充一个例子吧:

User-agent:*

Allow:/nihao/qincai

Disallow:/nihao/

这个写法将会阻止爬行:http://baidu.com/nihao/abc或者http://baidu.com/nihao/

但不会阻止爬行:http://baidu.com/nihao/qincai123或者http://baidu.com/nihao/qincai/123

文章结尾问你一个问题,你可以迅速回答出来吗?请问robots.txt里出现disallow是对的吗?

相关文章

找一个黑客的外国电影-黑客所说的社工是什么意思(社工在黑客中什么意思)

找一个黑客的外国电影-黑客所说的社工是什么意思(社工在黑客中什么意思)

找一个黑客的外国电影相关问题 黑客十字面具图像相关问题 怎么黑客他人的微信聊天记录 电脑新手基本常识(lol新手入门常识)...

如何查开的房记录查询_监控老婆的微信的方法

作为一个运营可能是营销人员该如何操作人类大脑的认知改变他们的决定呢? 之前交换了大脑决定组织形式,看到了有趣的图,如下: 并且,影响决定行为:老板>老板娘>阐明师。 那么 作为一个运...

北京高端商务陪伴女儿在线预约郑尔珍

北京高端商务陪伴女小学妹在线预约【郑尔珍】,上海是一座成功人士的聚集地,对商业模特的需求也是比较大的,今天明星商务分享模特访梦,年龄郑州 女 25,婚姻:未婚,学历:高中,气质:北京高端商务陪伴女小学...

盗取qq黑客联系方式-怎么寻找网络黑客(怎么寻找网络黑客高手)

盗取qq黑客联系方式-怎么寻找网络黑客(怎么寻找网络黑客高手)

盗取qq黑客联系方式相关问题 求黑客高手帮忙拿短信验证码相关问题 黑客exp指什么 身份证到期怎么修改银行个人资料(身份证到期了怎么换证...

我的黑客老婆叶宁(我的黑客老婆叶宁最新章节)

我的黑客老婆叶宁(我的黑客老婆叶宁最新章节)

本文目录一览: 1、《我的黑客路》txt下载在线阅读全文,求百度网盘云资源 2、求女主是黑客的小说 3、我的黑客女友txt全集下载 4、我下载的Word文档中每行之间都有回车行,弄的文章很...

项目管理过程中,如何实现可视化价值?

项目管理过程中,如何实现可视化价值?

2019年10月,在上海的TED演讲现场上,华人修建设计师马岩松先生在先容着他在海表里那些天马行空的修建作品:灵感来自山、云和火山的都市修建。 一幢幢线条美妙,很是大度同时也长短通例的修建案例在人们...