robots.txt文件问题攻略大全,本文中小六SEO将大家常遇到的关于robots.txt文件的相关问题进行汇总 ,希望大家又长知识了 。
1、robots.txt是什么?
解答:robots.txt是一个纯文本文件。简单说就是一个互联网协议,是针对搜索引擎蜘蛛抓取网站时的一个提前声明。通过robots.txt文件告诉蜘蛛,该网站的哪些文件你能访问抓取 ,哪些文件不要去访问抓取,从而规避一些隐私文件或不想被收录的文件被蜘蛛爬取到,起到一个引导蜘蛛的作用 。
搜索引擎蜘蛛爬取网站的之一个文件会优先选择robots.txt文件 ,所以在引导蜘蛛时robots.txt文件就显得尤为重要。
2 、robots.txt写法
解答:robots.txt文件的写法,小六SEO在《robots编写秘籍》一文中有详细的说明,这里做几个重点说明。
user-agent: 这里的星号 ,代表泛指所有的搜索引擎,如需要特指某个蜘蛛,则将各个搜索引擎蜘蛛的名称写下即可 。
各大常用搜索引擎蜘蛛名称如下:
google蜘蛛:googlebot
百度蜘蛛:baiduspider
yahoo蜘蛛:slurp
alexa蜘蛛:ia_archiver
msn蜘蛛:msnbot
bing蜘蛛:bingbot
altavista蜘蛛:scooter
lycos蜘蛛:lycos_spider_(t-rex)
alltheweb蜘蛛:fast-webcrawler
inktomi蜘蛛:slurp
有道蜘蛛:YodaoBot和OutfoxBot
热土蜘蛛:Adminrtspider
搜狗蜘蛛:sogou spider
SOSO蜘蛛:sosospider
360搜蜘蛛:360spider
屏蔽所有蜘蛛写法:
user-agent:
disallow: /
提示:这里的斜杠代表网站根目录。
屏蔽单个搜索引擎蜘蛛写法(如屏蔽谷歌):
user-agent:googlebot
Disallow: /
屏蔽单个目录:
user-agent:
Disallow: /a/
提示:若a后面不加斜杠/a,表示以a形成的所有文件都屏蔽;加斜杠/a/表示只代表a目录下的所有文件。
屏蔽单个页面:
user-agent:
Disallow: /123.html
屏蔽某一类后缀文件(如jpg图片):
user-agent:
Disallow: /.jpg
屏蔽某个指定二级域名:
user-agent:
Disallow: http(s)://123.seo-6.com
释放已屏蔽目录中的某个文件:
来自小咖秀视频网站的福利, 题目:名学姐知道—-若何摄影显胸大, 好像是葛布版的《学姐知道》的配音,然后网友上传的视频。 最近这个网站福利满满,一会重点研究一下。。 旁观地址:小咖秀 (民...
1、google关键词广告是什么? 答:google官方对这个广告的英文描述叫adwords,它是显示在搜索结果页面右侧的网站链接广告。它是属于CPC(cost-per-click)收费——按点击次...
小寒节气时的天气已经非常寒冷了,但无论是什么时候,家里都需要一些生气来点缀,很多人都喜欢在家里养花,但是适合冬天养的花并不多,也没有什么农作物适合冬季种植,接下来大家就和小编一起了解一下小寒节气有什么...
本文目录一览: 1、朋友QQ邮箱被盗发来的文件点开了,要怎么办 2、QQ好友被盗号了,给我发了一个链接,我不小心点开了,然后我立马就改密码了,这样我还会被盗号吗? 3、qq上有人发链接这是你?...
机器人在各地都是正式的- 它们可以帮助我们生活的几乎每个部分,从购物和送礼到新闻跟踪和政治决策。他们甚至可以告诉我们晚餐吃什么。机器人在强调情报时过分强调人工智能然而,对我来说似乎很奇怪的是整个机器人...
相信现在有很多的朋友们对于 验房和样板间面积不符怎么办 都想要了解吧,那么今天小编就来给大家针对 验房和样板间面积不符怎么办...