3 爬虫技术基础1——网页结构基础
查看网页源代码—F12按住F12或者Fn+F12,弹出来的界面叫开发者工具左上角为选择按钮(点击之后再点击你想选中的内容他就会跳转到对应的代码)其中Elements为(元素)选项卡,找到对应的文本进行修改,网页就会对应的修改查看网页源代码—右键菜单通过此操作能查看所需内容再网页源代码的位置,通过此方式打开也能通过Ctrl+F搜索(显示的为网页框架)网址构成和http与https协议“ https:
·
查看网页源代码—F12
按住F12或者Fn+F12,弹出来的界面叫开发者工具
左上角为选择按钮(点击之后再点击你想选中的内容他就会跳转到对应的代码)
其中Elements为(元素)选项卡,找到对应的文本进行修改,网页就会对应的修改
查看网页源代码—右键菜单

通过此操作能查看所需内容再网页源代码的位置,通过此方式打开也能通过Ctrl+F搜索(显示的为网页框架)
网址构成和http与https协议
“ https:// ”称为heeps协议,表明该网址某种程度上是安全的;有些网址则是:“ http:// ”
import requests
url = 'https://www.baidu.com/'
res = requests.get(url)
print(res.text)
网页结构初步了解

总的来说就是大框套小框,这样的缩进结构,一般文本内容在最小框里,其余的都为可变参数
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)