在SEO工作中,SEO人员每天都在与内容和链接打交道,从目前来看,他们深知独立的原创内容,对于未来站点长期发展的重要性,但这一切的开始,都有一个前提,那就是避免产生“蜘蛛陷阱”。那么什么是蜘蛛陷阱?
“蜘蛛陷阱”是什么?
“蜘蛛陷阱”是阻止蜘蛛程序爬行网站的障碍物,一些网站设计技术对搜索引擎说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。 更大的特点是当蜘蛛抓取某个特定URL的时候,它便进入了无限循环,只有入口,没有出口。
常见的“蜘蛛陷阱”有哪些:
1、站内搜索
这是一个常见且容易造成“蜘蛛陷阱”的地方,当你试图在站内搜索某些特定关键词的时候,如果类似search.php?q=这样的URL地址被搜索引擎抓取与收录,那么很可能产生大量无意义的搜索结果页面。
解决:你可以通过Robots.txt这个文件,屏蔽动态参数。
2、电商产品
如果你以往有过操作电商网站的经历,那么你会遇到产品SKU的多样性的问题,同一个主题内容,会根据SKU的不同,产生多个URL,造成大量的内容重复页面,这也导致严重浪费蜘蛛抓取频率。
当然,还有一种特殊的“蜘蛛陷阱”与电商产品页面类似,就是动态的内容插入,这也往往导致蜘蛛陷入温柔的陷阱。
解决:确保URL的规范性,你可以试图利用rel=canonical这个标签来解决类似问题。
3、Flash网站
为了满足用户的视觉体验,建站公司通常会使用Flash网站,给用户搭建企业官网,这样看起来非常美观,但由于目前搜索引擎并不能很好的抓取与识别flash内容,往往导致站点排名很难提升。
解决:不要做整站flash,尽量将flash嵌入网页内容的一部分。
4、限制性内容
对于一些站点,出去吸引粉丝的目的,很多内容只有登录才能查看,特别是一些强制cookie的操作,这诱导与欺骗了蜘蛛,它很难识别内容,并且不断的尝试抓取这个URL。
解决:针对网站建设,尽量避免采用这种策略,去吸引用户。
如何识别“蜘蛛陷阱”
对于识别蜘蛛陷阱的 *** ,特别容易,你只需要通过如下内容:
① 网站日志:利用工具读取当日蜘蛛抓取URL的内容,如果发现特殊的URL地址,那么值得进一步关注。
② 抓取频率:查看百度搜索资源平台中抓取频率,如果某一天数值特别大,那么很可能陷入蜘蛛陷阱。
总结:常被讨论的蜘蛛陷阱还有网站框架、sessionid、各类跳转,本文只简单讲述了实际应用中常遇到的蜘蛛陷阱,仅供参考。
你以为呢,这种没啥用的,如果不想被攻,那就好好做协议端口限制一下。 不用问了,只要是DDOS这4个字就是主机了。 因为他打开的就是“黑客DDOS”网站。 没办法,ddos是最难防御的攻击方式,它是一种...
5G是什么通过英航手机APP运用进行付款操作的乘客相关信息受到影响2019年下半年,各政企组织、大中型企业应继续加强内部网络安全建造,树立完善的应急处置机制,进步本身网络环境对突发安全事情的抵挡才能。...
深蓝色 全新梅赛德斯奔驰G500 很优雅 质感好到炸 适合文质彬彬内心有小狂野的壕 ...
说到消暑,很多人首先想到雪糕。骄阳似火的午后,吃上一根冰凉的雪糕,既美味解馋又解乏消暑。不过,那些花花绿绿、口感各异、香气特别的雪糕中都有什么成分呢? 仔细辨别配料表的内容,可以发现,除了大家熟知的...
等了一年的《歌手》终于再度回归,这一季的阵容相信各人都有听闻你心中的冠军之选是谁呢?但于我最体贴的是《歌手》的宣传文案,用心且燃的文案,超赞的视觉转达,歌手本年的文案依旧很棒~ #歌手#观念片首发 为...
《二十一世纪学生英文报》《二十一世纪学生英文报》,彩色印刷,每周出版,分小学、初一、初二、初三、高一、高二、高三。小学四开8版每期定价2.5元,初中。 1.坚持读,对于生词可先忽略,实在影响阅读的可以...