原标题:python制作一个简单网络爬虫

上一次说到http协议 然后我们现在用python标准库urllib2来实现简单的网络爬虫(本章很简单适合小白,不喜勿喷)

一、urllib2定义了以下方法:

urllib2.urlopen( URL, Data, timeout )

Data参数:POST数据提交(例如:账号密码发送给服务器判断登陆)

url参数:网页URL,可接受request对象。

返回一个类似于open文件对象 从中读取网页数据

urllib2.Request( URL, Data=None, headers={} )

注意R大写

Data为None时,发送的是GET请求,反之POST

二、urllib2小案例

21d7112065e348309880601958c81c98_th.jpg

获得以下数据:

Download Python 3.6.0:https://www.python.org/ftp/python/3.6.0/python-3.6.0.exe

Download Python 2.7.13:https://www.python.org/ftp/python/2.7.13/python-2.7.13.msi

以上就是一个简单的网络爬虫,有对python感兴趣或者想要学习python的朋友可以加群330637182,每天都会有免费python公开课学习的。让我们共同进步!

责任编辑:

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐