稳定的更新节奏与“圈养”蜘蛛大家都知道,只有被百度搜索引擎蜘蛛抓取并被百度收录的页面,才有可能参与到搜索结果排名的市场竞争中,所以怎样建立网站与百度搜索引擎蜘蛛之间的关系,是站长们最为关心的问题。
百度搜索引擎蜘蛛(又被称作:网页蜘蛛、 *** 爬虫),采用非常复杂的抓取策略去遍历 *** 中尽可能多的网站,而且还要在保证对网站用户体验不受影响的整体衡量下,抓取很多有价值的资源。各大百度搜索引擎每天都会安排很多蜘蛛,起点通常是权重较为高的网站或者是浏览量挺大的服务器。
百度搜索引擎蜘蛛会沿着内外链入口访问很多的网站页面,把网页信息内容存入数据库。就像图书馆一般把不一样的图书分类整理,最后压缩加密成自己能够 读取的方式放进硬盘上,供搜索的用户搜索。我们搜索的因特网,就是这个数据库。从百度搜索引擎蜘蛛抓取的原理来看,SEO站长要想培养蜘蛛定期抓取网站,需做到以下三点:
一、规律性更新高质量的网站文章
首先,百度搜索引擎蜘蛛喜欢抓取规律性更新的网站。从一定含义上说,网站的更新频率与抓取频率是成正比的。即便在网站前期没有蜘蛛来抓取文章,也要定期更新。这样蜘蛛才会获取并统计这个网站更新的规律性,定期来进行新增加内容抓取,使网站文章更新后,能够尽可能快的被抓取到。
其次,原创度、新鲜度较高的文章更易于被蜘蛛抓取百度收录。网站如果存在很多重复性的内容,会让蜘蛛觉得抓取太多而没有意义,还会使百度搜索引擎对网站质量产生质疑,甚至于会导致处罚。“新鲜度”主要指内容的受欢迎程度和实效性,近期发生的“大事”、“热门新闻”是较为易于被用户关心和被蜘蛛抓取。
除了上述两点外,关键词的分布也对蜘蛛的抓取有重要的影响。因为百度搜索引擎分辨页面内容的重要因素之一就是关键词,但是关键词过多的堆砌会被百度搜索引擎视为“作弊”行为,所以关键词的分布需在控制在2%-8%左右的密度。
二、确保服务器稳定工作
服务器的稳定性不但关系到网站用户体验度的问题,还会对蜘蛛的抓取造成很大影响。站长们应该定期检查服务器状态,查看网站日志,检查是否有500状态码等标记,及时发现存在的隐患。
如果网站遇到黑客攻击、服务器网站误删、服务器硬件瘫痪等问题,并且宕机超过12个小时,应该立即开启百度站长平台的闭站保护功能,防止百度误判断网站出现大量抓取无效及死链页面,应及时修复网站与服务器。
长期不稳定的服务器会导致蜘蛛不能有效爬取页面,降低搜索引擎友好度,从而出现收录下降、排名下降的情况。所以网站一定要选择性能稳定的服务器。
三、优化网站结构
如果网站内容好,但是页面却收录却寥寥无几时,多数是因为页面根本没有被蜘蛛爬取。这时就应该对网站进行全面检测,主要包括Robots文件、页面层级、代码结构、网站链接等方面。
1、Robots文件,全称“ *** 爬虫排除标准”(Robots Exclusion Protocol)。网站通过Robots协议可以告诉蜘蛛哪些页面可以抓取,哪些页面不能抓取。
2、页面层级,表现在网站物理层级结构、逻辑层级结构等多方面。以逻辑层级结构URL结构为例,方便记忆、层级简短、长度适中的静态URL是被搜索引擎蜘蛛所喜爱的。URL结构(以“/”为划分标志),一般不宜超过4层,结构太复杂不利于搜索引擎收录,也会影响到用户体验度。
3、网站代码类别、结构也会影响网页是否被蜘蛛抓取。如:IFRAME、JavaScript等代码,目前还不能被百度搜索引擎蜘蛛有效的理解、抓取,所以需要尽量减少这类代码的使用。另外,过大的代码量也会导致蜘蛛抓取不完全。
4、网站链接是网页间权重传递的“入口”,链接的数量和质量,直接影响到页面能否被蜘蛛抓取和收录。低质量链接堆砌只会给网站带来毁灭性的灾害,且还要及时排除错误链接和死链接,减少蜘蛛对死链接的抓取时间。尽量多从正规和相关站点获得反向链接,这样才可以提高网站的权重。
另外,网站也可以给蜘蛛提供一些快捷通道,比如sitemap。一个结构清晰的网站地图能让搜索引擎蜘蛛清楚的了解网站结构从而顺利的抓取整个网站页面。
通过高质量内容更新、优质的链接交换、以及合理网站结构,可以让搜索引擎蜘蛛更好的了解网站,抓取网站页面。但是不能为了吸引蜘蛛抓取而发布一些和网站内容无关的页面,或是过度优化网站。因为只有真正用心去做,并且能给用户带来价值的网站,才能被搜索引擎和用户喜欢。
4、网站链接是网页页面间权重传递的“入口处”,链接的数量和质量,直接影响到页面是否被蜘蛛抓取和收录。低质量链接堆砌只能给网站带来毁灭性的灾害,且还要及时排除错误链接和死链接,减少蜘蛛对死链接的抓取时间。 尽量多从正规和相关站点获得反向链接,这样才可以提高网站的权重。
另外,网站也可以给蜘蛛提供一些快捷入口处,比如sitemap。一个结构清晰的sitmap能让搜索引擎蜘蛛清楚的了解网站结构从而成功的抓取整个网站页面。
通过高质量内容更新、优质的链接交换、以及合理网站结构,可以让搜索引擎蜘蛛更好的了解网站,抓取网站页面。但是不能为了吸引蜘蛛抓取而发布一些和网站内容无关的页面,或是过度网站优化。因为只有真正的用心去做,并且能给用户带来价值的网站,才能被搜索引擎和用户喜欢。
家里拥有小宝宝以后宝宝皂不可或缺,在宝宝皂的挑选时要选宝宝专用型的品牌,目前市面上小宝宝专用型的洗衣皂怎么选择呢,下边的我就而言说:UZA宝宝洗衣皂如何 日本UZA小宝宝洗衣皂好不好用呢 日本...
2015年对小米手机创始人、CEO小米雷军而言并不易,最少比飞快挤进世界顶级手机制造商之首的前四年要难一些。我国手机行业趋向饱和状态,2020年上半年度小米手机销量只提高了33%,和2014年227%...
1.教辅书籍 在大大都人眼中教辅不外是一家信店销售一般进修向导用的书本,在现如今网络攻击下的普黄历店连保留都难以维持,但却殊不知书店行业中潜伏一个教辅市场,在现如今存活下来的书店百分之八十的利润来...
本文导读目录: 1、黑客帝国虚幻5怎么搜 2、黑客帝国总共有几部? 3、黑客帝国5配置要求 4、ps5版黑客帝国怎么下载 5、PS5去哪下载黑客帝国 6、《黑客帝国》三部曲谁全看懂...
本文导读目录: 1、求一部电影,中国拍的,貌似是关于黑客的 2、一部关于黑客的电视剧,日本的 3、求一部电影名字,只看了开头一点点好像继续看下去。外国片,讲一个年轻人电脑很厉害,做黑客的,后加...
余额宝从2013年6月横空出世,由于使用简单、购买门槛低、买卖零费用、收益高,更重要的是余额宝除了理财功能之外,还可以消费购物、转账、还信用卡等等。正是余额宝身怀绝技,才被越来越多的人喜爱,大家都将钱...