python爬取appstore的评论数据的步骤_如何获取itunes一款app的所有评论内容?爬虫?苹果提供的api?...
2019-7-9更新:提升python脚本的健壮性,改了一些bug新版代码如下:import urllib.requestimport jsonimport xlsxwriterprint("这是一个在线获取appstore里任意app的评论列表工具")print("运行完毕后 将生成一个名为“app评论.xlsx”的文件")page=1;appid=input("请输入应用id号:");#app
2019-7-9更新:
提升python脚本的健壮性,改了一些bug
新版代码如下:
import urllib.request
import json
import xlsxwriter
print("这是一个在线获取appstore里任意app的评论列表工具")
print("运行完毕后 将生成一个名为“app评论.xlsx”的文件")
page=1;
appid=input("请输入应用id号:");
#appid=1182886088
workbook = xlsxwriter.Workbook('app评论.xlsx')
worksheet = workbook.add_worksheet()
format=workbook.add_format()
format.set_border(1)
format.set_border(1)
format_title = workbook.add_format()
format_title.set_border(1)
format_title.set_bg_color('#cccccc')
format_title.set_align('left')
format_title.set_bold()
title=['昵称','标题','评论内容']
worksheet.write_row('A1',title,format_title)
row=1
col=0
count=0
#默认循环10次
while page<11:
myurl="https://itunes.apple.com/rss/customerreviews/page="+str(page)+"/id="+str(appid)+"/sortby=mostrecent/json?l=en&&cc=cn"
response = urllib.request.urlopen(myurl)
myjson = json.loads(response.read().decode())
print("正在生成数据文件,请稍后......"+str(page*10)+"%")
if "entry" in myjson["feed"]:
count+=len(myjson["feed"]["entry"])
#循环写入第1列:昵称
for i in myjson["feed"]["entry"]:
worksheet.write(row,col,i["author"]["name"]["label"],format)
row+=1
#循环写入第2列:标题
row=1+(page-1)*50
for i in myjson["feed"]["entry"]:
worksheet.write(row,col+1,i["title"]["label"],format)
row+=1
#循环写入第3列:内容
row=1+(page-1)*50
for i in myjson["feed"]["entry"]:
worksheet.write(row,col+2,i["content"]["label"],format)
row+=1
page=page+1
row=(page-1)*50+1
else:
print("正在生成数据文件,请稍后......100%")
break
if count==0:
print("运行完毕,未获取到任何数据。请检查是否输入正确!")
else:
print("生成完毕,请查阅相关文件,共获取到"+str(count)+"条数据")
workbook.close()
使用方式:安装python 3环境,不会的请百度
pip安装模块: XlsxWriter,用来生成excle文件 : pip install XlsxWrite
注意事项:
接口限制。最多获取500条;不足500条的话,有多少获取多少。
关于如何获取ID号
百度搜索:appstore+app名,点第一个,进入网站,看地址栏。
题外话:
有问题可以私信。
-------------------------------------------------------------------
以下是原来的回答内容:
最近也遇到了这个问题,感谢 @razrLeLe提供的接口,我用python写了个小程序,可以轻轻松松将500条评论导出到excle表格。需要的可以私信来拿。附上代码和截图:
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)