应该怎么处理网站运营中产生的死链

2018年4月5日

之前在给一家公司做方案的时候,发现网站有很多死链存在,当然了,一家运营了好几年的网站死链是不可能完全没有的。很多刚刚接触seo的人可能对死链不是很了解,也不知道大量的出现死链对搜索引擎会有什么影响?

对于搜索引擎来讲,一个网站的死链过多,会影响其对网站的评分,搜索引擎对每个网站每天抓取的频次是有限额的,如果网站存在大量的死链,会直接浪费掉所分配到的抓取配额,并影响其他页面的正常抓取。

哪么对于死链我们应该怎么处理呢?下面我就为大家介绍一下百度是怎么处理的,不过在处理之前,我们先来看看网站为什么会有出现死链?

1、网站页面的删除,seoer在管理网站时,偶尔会将一些无用的、被黑的、过时的或者是灌水的页面删除掉,而这些删除掉的页面的url已经被搜索引擎收录,索引建库,这样就会导致死链的出现。

2、因为服务器、空间或者是程序问题导致网站无法访问,产生大量返回码为5开头的服务器错误页面,而这些错误页面在网站恢复正常后就成了无效的死亡链接。

3、很多网站在做改版的时候,会将之前的老页面直接删除,这样做会导致大量的死链出现,因为之前老页面的url已经存在于索引库中。

4、因为网站编辑的失误或者程序员的大意,导致网站内部添加了错误的内部链接,从而产生了一些不存在的页面。

5、个别爬虫在提取页面url时,因为url中有不规则字符或者url与后边的文字链接起来,导致url失效。

在知道网站出现死链的原因后,要怎么发现网站中存在的死链呢?

1、百度站长工具中的抓取异常工具可以查看最近一个月产生的各种死链,并支持导出功能。

2、使用相关爬虫软件,比如Xenu,此类工具可以爬取全站所有链接并分析页面状态,分析完成后,支持导出功能,提取死链接即可。

3、在网站运营中,特别是论坛,经常需要删除某些页面,在删除页面时一定要记录对应的url以便后期提交死链。

通过百度站长工具和相关爬虫软件提取的死链列表,一定要经过删重和验证,比如用wps表格进行删除重复链接,然后再使用Http状态批量查询工具验证下是否确实是死链接。

百度对于死链的处理方法:

将收集好的所有死链接粘贴到记事本或者wps中保存为后缀为.txt或是.xml的文件后,上传到网站根目录中,再把文档地址提交到百度搜索资源平台——网站支持——数据接入——死链提交——文件提交/规则提交(若大量死链具有一定的规则,如某个目录下全部为死链接,可使用规则提交)。

特别注意:

1、在提交之前一定要确保提交的死链数据不存在活链接。一旦存在活链,会显示提交失败导致无法删除。

2、由于很多网站程序问题,很多打不开的页面返回码并非404,所以在提交之前,要确保页面返回码都是404状态。如果不是,要尽量找出所有错误的url,并将返回码设置为404.

 

没有评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注