文章前面先附上百度对网站死链的解释以方便新手站长理解:
页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
1)协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
2)内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
简单来说网站的死链对我们的影响主要有两方面:1)蜘蛛抓取异常。2)访客体验下降。或许相比于一个喜欢折腾的新手站长来说,一个经验丰富的站长在网站建设过程中产生的死链会少很多,但是这并不是说这样一个网站就没有死链。对于任何一个网站来说,网站死链都是不可避免的。不过不用担心,譬如百度站长平台、360站长平台、Google网站管理员、Bing网站管理员之类的网站管理工具都支持网站死链的提交,我们只需要将网站的死链找出来然后提交到这些平台就可以了。
如果要一条条的去筛选网站死链显然是不可能的,建站前期还好说,建站后期网站这么多链接一条条去筛选不累死才怪。这里给大家提供一段自动记录死链的代码方便大家获取网站死链。代码是从泪雪博客上看到的,主要是利用PHP来实现对网站404页面的死链进行输出,实现全自动记录。然后再利用死链提交的抓取周期,从而全面的实现全自动死链提交。
<?php //WordPress实现自动记录死链地址(防重复) if(is_404 && strpos($_SERVER['HTTP_USER_AGENT'],'Baiduspider') !== false){ $file = @file("badlink.txt");//badlink.txt $check = true; if(is_array($file) && !empty($file)) foreach($file as &$f){ if($f == home_url($_SERVER['REQUEST_URI'])."\n") $check = false; } if($check){ $fp = fopen("badlink.txt","a");//badlink.txt就是在网站根目录的记录死链的文件 flock ($fp, LOCK_EX) ; fwrite ($fp, home_url($_SERVER['REQUEST_URI'])."\n"); flock ($fp, LOCK_UN); fclose ($fp); } } ?>
代码使用方法简单,我们只需要将上述代码放到WordPress主题目录下的404.php文件(注意是404.php而不是function.php!!!)中,然后在网站根目录下新建一个badlink.txt的文件即可。配置完成后不要着急,等百度蜘蛛爬行你网站的时候才会在badlink.txt文件中记录下你的网站死链。
配置完上述内容后,我们只是通过代码自动获取了网站的死链,要想彻底删除死链我们还需要将死链文件提交到站长管理平台,这里以百度站长平台为例给大家说一下如何提交死链文件链接。
登录百度站长平台,点击“死链提交”然后按照上述步骤填写必要的信息点击提交即可。死链提交的文件格式为txt或xml,我们这里的badlink.txt文件是完全符合要求的,但是需要注意提交的文件最多包含50000个网址且需小于10MB才有效。
评论 (4)
好,正需要呢。
哈哈哈,有用就好。
好,绝对给力,支持
哈哈,好东西就是要分享。