robots.txt文件问题攻略大全,本文中小六SEO将大家常遇到的关于robots.txt文件的相关问题进行汇总 ,希望大家又长知识了 。
1、robots.txt是什么?
解答:robots.txt是一个纯文本文件。简单说就是一个互联网协议,是针对搜索引擎蜘蛛抓取网站时的一个提前声明。通过robots.txt文件告诉蜘蛛,该网站的哪些文件你能访问抓取 ,哪些文件不要去访问抓取,从而规避一些隐私文件或不想被收录的文件被蜘蛛爬取到,起到一个引导蜘蛛的作用 。
搜索引擎蜘蛛爬取网站的之一个文件会优先选择robots.txt文件 ,所以在引导蜘蛛时robots.txt文件就显得尤为重要。
2 、robots.txt写法
解答:robots.txt文件的写法,小六SEO在《robots编写秘籍》一文中有详细的说明,这里做几个重点说明。
user-agent: 这里的星号 ,代表泛指所有的搜索引擎,如需要特指某个蜘蛛,则将各个搜索引擎蜘蛛的名称写下即可 。
各大常用搜索引擎蜘蛛名称如下:
google蜘蛛:googlebot
百度蜘蛛:baiduspider
yahoo蜘蛛:slurp
alexa蜘蛛:ia_archiver
msn蜘蛛:msnbot
bing蜘蛛:bingbot
altavista蜘蛛:scooter
lycos蜘蛛:lycos_spider_(t-rex)
alltheweb蜘蛛:fast-webcrawler
inktomi蜘蛛:slurp
有道蜘蛛:YodaoBot和OutfoxBot
热土蜘蛛:Adminrtspider
搜狗蜘蛛:sogou spider
SOSO蜘蛛:sosospider
360搜蜘蛛:360spider
屏蔽所有蜘蛛写法:
user-agent:
disallow: /
提示:这里的斜杠代表网站根目录。
屏蔽单个搜索引擎蜘蛛写法(如屏蔽谷歌):
user-agent:googlebot
Disallow: /
屏蔽单个目录:
user-agent:
Disallow: /a/
提示:若a后面不加斜杠/a,表示以a形成的所有文件都屏蔽;加斜杠/a/表示只代表a目录下的所有文件。
屏蔽单个页面:
user-agent:
Disallow: /123.html
屏蔽某一类后缀文件(如jpg图片):
user-agent:
Disallow: /.jpg
屏蔽某个指定二级域名:
user-agent:
Disallow: http(s)://123.seo-6.com
释放已屏蔽目录中的某个文件:
最近玩万国觉醒这个游戏的玩家都在问,作为新手开局应该怎么玩?这个游戏在今天公测,有很多新来的小伙伴想知道开局后如何快速发展,抢占先机,小编我特意整理了相关的资讯,下面就是蚕豆网带来的万国觉醒新手玩法攻...
大脚骨治疗(上海治疗大脚骨哪家医院好) 大脚骨,又可称之为拇外翻,主要是指拇趾向外倾斜大于生理角度十五度的一种畸形症状。引起大脚骨出现的原因为位于大拇趾底部的关节脱位,致使大拇趾往外侧弯,进而导致拇...
在旧社会一直流传着重男轻女的封建思想,而随着时代的进步现在的年轻一代很少会有这种思想,女儿成了掌中宝,不少爸爸更是成了妥妥的女儿奴。之前就有朋友在问2020年寒露出生的女孩是什么命,2020年寒露出生...
刚刚出来做的站长,一定不想投资钱去购买空间域名之类的,其实早期我也是这样的,但互联网有很多免费的资源我们其实是可以利用的,比如100m免费空间可以用来建站学习,那么今天小编教大家申请100m免费空间!...
如今随着大家的生活水平不断的提升,餐饮行业的生意也在不断的发展进步,现在加盟创业也已经不在是什么私密的话题了,现在有很多加盟项目出现,真是让人目不暇接,在众多加盟项目中克拉拉加盟项目就是很不错的加盟选...
鳄鱼,是现存世界上最大的爬行动物,它们是曾经驰骋地球的恐龙的遗存。 1.8亿年前,爬行动物们统治着地球,无论是天空、陆地、海洋,到处都遍布着它们的身影,直到6500万年前,它们几乎全部消失,但是来自...