python爬取数据返回空列表_Xpath在选择器中正确，在代码中返回的是空列表问题...

一、问题：在进行爬虫的时候我们会用到xpath解析html文件，但是会有一种情况就是在xpath选择器中可以使用，但是在代码中就无法使用的情况。二、原因：1.是元素中有tbody的原因，这个元素是html生成时产生的，在使用xpath解析的时候无法解析，因此返回的列表为空值。2.是因为没有写入获取的内容。比如在xpath选择其中可以使用但是在解析中没有带入//text()三、解决办法：1.因此解决

weixin_39712865

2242人浏览 · 2020-11-29 14:04:41

weixin_39712865 · 2020-11-29 14:04:41 发布

一、问题：

在进行爬虫的时候我们会用到xpath解析html文件，但是会有一种情况就是在xpath选择器中可以使用，但是在代码中就无法使用的情况。

二、原因：

1.是元素中有tbody的原因，这个元素是html生成时产生的，在使用xpath解析的时候无法解析，因此返回的列表为空值。

2.是因为没有写入获取的内容。比如在xpath选择其中可以使用但是在解析中没有带入//text()

三、解决办法：

1.因此解决办法便是删除掉tbody这个标签元素，因为它含有一个id的属性，所以不能使用这个属性。

2.解析中带上//text()

1 content_text = ''.join(content.xpath('*//article[@class]/p[position()>2]//text()')).replace('\n', '').replace(' ', '')

2 time_ = ''.join(content.xpath('//*[@id="news-time"]//text()'))

3 origin = ''.join(content.xpath('//*[@id="user-info"]/h4/a//text()'))

四、参考：

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

cover

工业物联网时序数据库选型指南：Apache IoTDB 技术架构与实战解析

cover

面向未来的工业大数据架构：时序数据库（TSDB）选型避坑指南和国产化思考

cover

基于springboot框架会议室预约网站管理系统设计与实现

所有评论(0)

查看更多评论

weixin_39712865

@weixin_39712865

已为社区贡献14条内容