【2019全国职业技能大赛大数据技术】任务三:12-数据清洗与分析(25分_题目+答案<图片+分值>)
【题目】9、 高端酒店的数量,从一个侧面反映了当地的经济水平,据国家旅游和文化部统计境内 31 个省市(不含港澳台)共有 860 家五星级酒店,但分布很不均衡,其中东部沿海所占有的五星级数量,接近了全国一半。请你根据题目要求统计符合参数要求的高端酒店相关信息,并写入指定的数据库或数据文件,截图并保存结果。详细描述:1) 请以上述3、 、 (题目数字编号)任务的输出结果作为输入数据源,编写Spark
【题目】
9、 高端酒店的数量,从一个侧面反映了当地的经济水平,据国家旅游和文化部统计境内 31 个省市(不含港澳台)共有 860 家五星级酒店,但分布很不均衡,其中东部沿海所占有的五星级数量,接近了全国一半。请你根据题目要求统计符合参数要求的高端酒店相关信息,并写入指定的数据库或数据文件,截图并保存结果。
详细描述:
1) 请以上述3、 、 (题目数字编号)任务的输出结果作为输入数据源,编写Spark程序统计北京、上海、广东、四川、海南各地四星/五星酒店的数量、平均评分、评论数、城市出租率,直销拒单率, 输出至 HDFS 文件系统中/hotelsparkhive3。
具体任务要求:
1) 运行代码,统计北京、上海、广东、四川、海南各地四星/五星酒店的数量、平均评分、评论数、城市出租率、直销拒单率,并在控制台打印统计结果,将打印输出结果截图并保存(截图需包含打印语句输出结果的上下各 5 行运行日志)。
【答案】
参考答案截图:每个红框区域结果一致得 0.5 分; (两个红框共 1 分 )

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


所有评论(0)