您好,欢迎来到点评了网站分类目录,在这里您可以寻找您所想要的网站地址,并点评您访问过的网站怎么样!

404页面是什么,404该如何处理

时间:2016-10-31 来源:百度站长平台 浏览:303次

  HTTP 404或Not Found错误信息是HTTP的其中一种“标准回应信息”(HTTP状态码),此信息代表客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应且不知原因。

  搜索引擎蜘蛛在请求某个URL时得到“404”状态回应时,即知道该URL已经失效,便不再索引该网页,并向数据中心反馈将该URL表示的网页从索引数据库中删除,当然,删除过程有可能需要很长时间;而当搜索引擎得到“200”状态码时,则会认为该url是有效的,便会去索引,并会将其收录到索引数据库,这样的结果便是这两个不同的url具有完全相同的内容:自定义404错误页面的内容,这会导致出现复制网页问题。

基本涵盖了所有问题

HTTP 400 – 请求无效

HTTP 401.1 – 未授权:登录失败

HTTP 401.2 – 未授权:服务器配置问题导致登录失败

HTTP 401.3 – ACL 禁止访问资源

HTTP 401.4 – 未授权:授权被筛选器拒绝

HTTP 401.5 – 未授权:ISAPI 或 CGI 授权失败

HTTP 403 – 禁止访问

HTTP 403 – 对 Internet 服务管理器 的访问仅限于 Localhost

HTTP 403.1 禁止访问:禁止可执行访问

HTTP 403.2 – 禁止访问:禁止读访问

HTTP 403.3 – 禁止访问:禁止写访问

HTTP 403.4 – 禁止访问:要求 SSL

HTTP 403.5 – 禁止访问:要求 SSL 128

HTTP 403.6 – 禁止访问:IP 地址被拒绝

HTTP 403.7 – 禁止访问:要求客户证书

HTTP 403.8 – 禁止访问:禁止站点访问

HTTP 403.9 – 禁止访问:连接的用户过多

HTTP 403.10 – 禁止访问:配置无效

HTTP 403.11 – 禁止访问:密码更改

HTTP 403.12 – 禁止访问:映射器拒绝访问

HTTP 403.13 – 禁止访问:客户证书已被吊销

HTTP 403.15 – 禁止访问:客户访问许可过多

HTTP 403.16 – 禁止访问:客户证书不可信或者无效

HTTP 403.17 – 禁止访问:客户证书已经到期或者尚未生效 HTTP 404.1 -

无法找到 Web 站点

HTTP 404- 无法找到文件

HTTP 405 – 资源被禁止

HTTP 406 – 无法接受

HTTP 407 – 要求代理身份验证

HTTP 410 – 永远不可用

HTTP 412 – 先决条件失败

HTTP 414 – 请求 – URI 太长

HTTP 500 – 内部服务器错误

HTTP 500.100 – 内部服务器错误 – ASP 错误

HTTP 500-11 服务器关闭

HTTP 500-12 应用程序重新启动

HTTP 500-13 – 服务器太忙

HTTP 500-14 – 应用程序无效

HTTP 500-15 – 不允许请求 global.asa

Error 501 – 未实现

HTTP 502 – 网关错误

  通常情况下,正常网站将自动返回404状态码,搜索引擎进行更新并删除,避免对网站用户及搜索引擎带来负面影响。但问题来了,该网站只删除了内容,没有任何主体内容的页面被保存了下来,未做404处理。当然,存在一类网站只删除内容后返回正常200状态码,提醒一句“该内容已删除”,但其都没有。可以发现目前这个搜藏中的url仍然正常返回200,造成的后果:搜索引擎将花费大量的资源在这种无效页面上,那么,同等耗损下用在重要页面上的资源将被大量挤占,可想而知,正常优质页面在搜索引擎的部分表现将受到影响。经过我们运营同学的多方沟通下至今仍未进一步处理。我觉得,21世纪第二个十年了,这种问题不应该再存在了的。

  好吧,承认我被打败了。简单说一下:

  404状态码代表‘Not Found’,spider更新时会认为该页面已失效,此时呢将在索引库中删除,短期内spider再次发现该url不再会抓取。因此,出来了两类问题:第一,网页临时性打不开;第二,页面永远无法打开。针对第一类问题,我建议不要立刻返回404,而是使用503。503等同于告诉spider该页面临时访问不了,过段时间再来光临。关于503,spider会认为该网页临时无法访问,短期内会再光临。如果网页已经恢复,即刻正常抓取;如果继续返回503,短期内还会再光临几次,但如果该页面长时间返回503,该url仍会被认作失效链接,从索引库中删除。针对第二类问题,永远无法打开的页面,404,不用考虑。各种web2类页面删除后同样需要返回404告知搜索引擎该页面已失效。

  回归之前那个网站,删除内容后该页面没有任何价值。最恰当的处理是:

  1、直接做死链处理并返回404;

  2、在百度站长平台死链提交工具中提交死链sitemap。

  最后呢,提醒一下各位站长朋友,当您的网站存在被发布大量垃圾信息时,请:

  1、及时删除相关垃圾页面,并做404处理;

  2、制作符合要求的死链sitemap;

  3、登录百度站长平台,进入死链提交工具提交死链sitemap。