解决:

将settings.py文件中的

ROBOTSTXT_OBEY = False

修改为

ROBOTSTXT_OBEY = True

详细:

settings.py文件中的

ROBOTSTXT_OBEY = True

在terminal输入

>scrapy shell "https://www.baidu.com/"

[scrapy.core.engine] DEBUG: Crawled (200)

robots.txt

> (referer: None)

[scrapy.downloadermiddlewares.robotstxt] DEBUG:

Forbidden by robots.txt

:

由上面可知

Forbidden by robots.txt

,被禁止了

修改settings.py为

ROBOTSTXT_OBEY = False

时,

[scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (meta refresh) to

4b&vit=fps?from=844b&vit=fps&index=&ssid=0&bd_page_type=1&logid=7889072453155394709&pu=sz%401321_480&t_noscript=jump> from

DEBUG: Crawled (200)

&ssid=0&bd_page_type=1&logid=7889072453155394709&pu=sz%401321_480&t_noscript=jump> (referer: None)

此时成功!!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐