返回

教你三步轻松解除百度蜘蛛封禁

2022-06-14内容来源百度搜索资源平台

为什么网站或智能小程序资源的内容非常优质,但是没有查询到百度蜘蛛抓取记录,或在百度搜索中没有得到收录和展现?

有可能是部分网站或智能小程序存在封禁百度蜘蛛的情况,导致百度蜘蛛无法正常抓取,所以无法在百度搜索中正常收录和展现。

常见的封禁行为包括robots封禁、封禁百度UA、封禁百度IP等。

如何验证网站和智能小程序是否存在封禁百度蜘蛛的情况?快来按照以下方法自查吧~

1、自查robots.txt文件

首先, 开发者们先查看robots.txt文件,是否存在封禁记录。一般robots.txt文件放置在网站根目录下~

【建议方案】如果存在robots封禁的情况,请开发者们及时修改或者删除robots.txt文件。

2、自查是否封禁百度UA

如果开发者们自查robots.txt文件无异常,可以进一步排查是否存在封禁百度UA情况。

执行代码进行自查

执行以下命令进行排查:

curl--head--user-agent'Mozilla/5.0 (compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)'--request GET 'xxxxxxx'

xxxxxxx为网站域名,如:http://www.wzbke.com

注意:如果站点正常,不存在封禁百度UA的情况,则其返回码是200,如出现其他返回码为异常。

变更浏览器进行UA验证

通过观察站点资源在其他浏览器是否得到正常的抓取和收录,来判断网站是否有封禁百度UA的情况。

【建议方案】查看网站反爬虫策略,进行策略调整,解除百度UA封禁;或者针对百度UA添加策略白名单。

3、自查是否存在IP封禁

如果以上验证均无异常,开发者们则可以排查是否存在IP封禁的情况。

常见的IP封禁,源自网站的防火墙系统配置,需要查看防火墙配置系统后台,检查是否存在百度蜘蛛的IP级别封禁措施。

【建议方案】查看网站反爬虫策略,进行策略调整,解除百度IP封禁。

电脑版

站长百科

猜你感兴趣

  • 教师节
    教师节
    专门为教师设立的节日
  • 时代财经
    时代财经
    财经新媒体平台
  • 东北大学
    东北大学
    NEU,公办高校,双一流,985工程,211工程,全国重点大学
  • 易安保险
    易安保险
    医疗险,重疾险,意外险,团体险,旅游险,家财险,保险公司,比亚迪财险
  • 法宣在线
    法宣在线
    无纸化学法用法及考试系统
  • 大家都在看

  • 全景网
    全景网
    资本市场路演互动平台
  • 底线
    底线
    靳东,成毅,蔡文静,王秀竹,曾梦雪,王莎莎,王放,吴恙,胡浩博,王梓权
  • 爱装网
    爱装网
    互联网装修服务平台
  • 5566精彩网址大全
    5566精彩网址大全
    5566网址,网址大全,网址之家,网址导航,精彩网址
  • 溯心文化
    溯心文化
    综合性电竞服务公司