网站地址

4K美女壁纸_高清4K美女图片大全_彼岸图网

爬虫代码

仅做参考

# 获取图片数据
import os.path
import requests
from lxml import etree
import time


pic_name = 0
def start(url):
    print(f'开始爬取{url}')
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'}
    # 发送请求
    response = requests.get(url, headers=headers)
    # 获取想要的数据
    res_text = response.text
    # 数据解析
    tree = etree.HTML(res_text)
    li_list = tree.xpath("//div[@class='slist']/ul/li")
    for li in li_list:
        # 图片的url
        img_url = "https://pic.netbian.com" + "".join(li.xpath("./a/img/@src"))
        # 发送请求
        img_response = requests.get(img_url, headers=headers)
        # 获取想要的数据
        img_content = img_response.content
        global pic_name
        with open(f"./result/{pic_name}.jpg", "wb") as fp:
            fp.write(img_content)
        pic_name += 1

if __name__ == '__main__':
    # 创建存放照片的文件夹
    if not os.path.exists("./result"):
        os.mkdir("./result")
    # 网站的url
    url = "https://pic.netbian.com/4kdongman/"
    start(url)
    for i in range(1,30):
        next_url = f"https://pic.netbian.com/4kmeinv/index_{i}.html"
        time.sleep(1)
        start(next_url)

爬虫结果

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐