2024 批量抓取公众号文章数据,包括阅读数点赞数在看数留言数, 以深圳卫健委这个号为例做数据分析
2023年我写了个脚本抓取公众号阅读数点赞数在看数留言数做数据分析, 这里以深圳卫健委2022年的文章为例:抓取的数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,赞赏次数等。然后用python pandas分析excel里的数据:文章总数量1736篇:没有原创文章:头条1622篇,次条95篇,3条16篇,4条3篇:阅读数1
2023年我写了个脚本抓取公众号阅读数点赞数在看数留言数做数据分析, 这里以深圳卫健委2022年的文章为例:
抓取的数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,赞赏次数等。
然后用python pandas分析excel里的数据:
文章总数量1736篇:
>>> len(wechat)
1736
没有原创文章:
>>> wechat.是否原创.value_counts().sort_values(ascending=False).head(5)
否 1736
Name: 是否原创, dtype: int64
头条1622篇,次条95篇,3条16篇,4条3篇:
>>> wechat.文章位置.value_counts().sort_values(ascending=False).head(5)
1 1622
2 95
3 16
4 3
Name: 文章位置, dtype: int64
阅读数10万+的文章有1731篇,总阅读数173520590,近2亿,平均阅读数,点赞数,在看数和留言数:
当然每篇文章下的留言内容也可以单独导出excel,包含文章日期,文章标题文章链接,留言昵称,留言内容,点赞数,回复和留言时间,比如深圳卫健委在2月份就有1万6千多条留言
还有将下载的所有文章合并成一个pdf文件(含留言),点击左侧书签跳转到对应文章,在电脑和手机上看方便多了:
再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数
微博图床又搞事情不能用了,盘它,我顺便写了个微博图片/视频/内容/文章批量下载工具

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)