import urllib.request #导入urllib库

url= "http://edu.csdn.net/courses"  #把网址付给url
data = urllib.request.urlopen(url).read()# 使用urllib.request.urlopen()的方法.read()读取url
data = data.decode('UTF-8')#
print(data)

读取csdn网页,现在我们要把网页中讲课老师名字提取出来

import re #导入正则表达式库 pat="<p>讲师:(.*?)</p>" # 设置正则表达式 提取标题 讲师(.*?)贪婪模式 ret=re.compile(pat).findall(data )#使用compile方法 找出data 里边所以的讲师的名字 print(ret)#打印出来   

 

     

import urllib.request
import re
url= "https://read.douban.com/provider/all"  
data = urllib.request.urlopen(url).read()
data = data.decode('UTF-8')
#print(data)

pat='<div class="name">(.*?)</div>'
ret=re.compile(pat).findall(data )
print(ret)

 

转载于:https://www.cnblogs.com/duxiao/p/7544754.html

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐