计算机毕业设计Hive+Hadoop深圳共享单车预测系统 共享单车数据分析可视化大屏 共享单车爬虫 共享单车数据仓库 机器学习 深度学习 PySpark
计算机毕业设计Hive+Hadoop深圳共享单车预测系统 共享单车数据分析可视化大屏 共享单车爬虫 共享单车数据仓库 机器学习 深度学习 PySpark
·
步骤:
1.Python采集深圳政府公开数据平台的共享单车数据(最大可采集上亿2017-2021数据),并用百度逆地理编码服务解析经纬度获取位置信息。并将数据上传hdfs;
2.可使用sklearn、卷积神经网络等算法对数据进行分析,对共享单车的订单量进行有效预测;
3.使用PyHive、Hadoop等技术对hdfs中的共线单车数据进行离线分析(有需要的话后期可以改造成PySpark Scala Spark Flink PyFlink分析);
4.对3中的分析指标使用sqoop导入到mysql数据库;
5.使用flask+echarts+layui搭建可视化系统、hive数据查询系统;
6.大屏端直接查询Mysql指标表的数据完成可视化。hive数据仓库查询系统连接虚拟机中的hive进行多条件数据检索;
创新点、爬虫、百度逆地理编码解析、预测算法、可视化大屏、PyHive新技术的应用











魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)