轨迹数据集分享

近期有众多读者私信交流,希望获取交通轨迹数据集。我在数年前学习数据分析课程时,由于兴趣恰好接触了数据分析的全流程。近两年来,由于公众号的定位,我时常接触数据分析的相关流程,本文分享一些交通轨迹数据集资源。

1、无锡市出租车轨迹数据集

数据描述:位于无锡的车辆轨迹数据,时间跨度为2020年7月18日到2020年8月17日。

数据字段

  • id - 车辆标识
  • 经度 - 经度坐标
  • 纬度 - 纬度坐标
  • 采集时间 - 数据采集时间戳
  • 方向 - 行驶方向
  • 速度 - 瞬时速度
  • 纵向加速度 - 纵向加速度值
  • 横向加速度 - 横向加速度值
  • 垂直加速度 - 垂直方向加速度
  • 横摆角速度 - 横摆角速度

dataset1

特点

  • 数据连续性强
  • 数据量完整
  • 结构化数据
  • 数据量大(约数千万条数据)

example data 1


2、2021年深圳市车辆轨迹数据

数据描述:2021年深圳市车辆轨迹数据

数据字段

  • VehicleID - 车辆ID
  • TripID - 行程ID
  • Points - 轨迹点
  • Departure - 出发信息
  • Time - 时间信息
  • Duration - 持续时间
  • Length - 行程长度

dataset2

特点

  • 数据量大(约数百万条)
  • 包含区域路网的节点和路段
  • 结构化数据

example2


3、重货GPS数据

数据描述:2025年二月重型货车GPS数据

数据字段

  • fstr_id - 车辆标识
  • fdt_time - 时间戳
  • lng - 经度
  • lat - 纬度
  • fstr_type1 - 类型1
  • fstr_type2 - 类型2
  • fstr_type3 - 类型3

dataset3

特点

  • 数据量巨大(数千万条)
  • 时间连续
  • 数据类型具有针对性
  • 空间跨度大

example3


4、深圳市2018年10月份出租车数据

数据描述:深圳市2018年10月份出租车轨迹数据

数据字段

  • elevation - 海拔高度
  • recorder_speed - 记录速度
  • system_time - 系统时间
  • plate_color - 车牌颜色
  • gps_time - GPS时间
  • to_police_num - 警员编号
  • plate_num - 车牌号码
  • gps_longitude - GPS经度
  • erro_type - 错误类型
  • gps_speed - GPS速度
  • operator - 操作员
  • map_latitude - 地图纬度
  • map_longitude - 地图经度
  • gps_latitude - GPS纬度
  • event - 事件类型
  • direction - 方向
  • mileage - 里程

example1

example2

特点

  • 数据连续性强
  • 数据量完整
  • 结构化数据
  • 数据量大(约数千条)
  • 字段丰富
  • 数据挖掘方向多样

explain


5、公交车20250209-20250212刷卡数据

数据描述:2025年2月9日至12日公交车刷卡数据

数据字段

  • city_code - 城市代码
  • industry_code - 行业代码
  • company_code - 公司代码
  • line_id - 线路ID
  • device_id - 设备ID
  • driver_no - 驾驶员编号
  • carpark_serial_no - 停车场序列号
  • carpark_no - 停车场编号
  • stop_serial_no - 站点序列号
  • stop_no - 站点编号
  • lon - 经度
  • lat - 纬度
  • ts - 时间戳
  • speed_sensor - 传感器速度
  • speed_gps - GPS速度
  • direction - 方向
  • in_temp - 内部温度
  • service_state - 服务状态
  • control_state - 控制状态
  • total_miles - 总里程
  • water_temp - 水温
  • oil_consumption - 油耗
  • engine_speed - 发动机转速
  • inout_stop - 进出站状态
  • days_year - 年天数
  • hours_day - 日小时数
  • server_ts - 服务器时间戳
  • create_date - 创建日期
  • section_code - 路段代码

dataset2

线路站点

特点

  • 数据连续性强
  • 数据量完整
  • 结构化数据
  • 数据量大(约数千万条)
  • 字段丰富
  • 数据挖掘方向多样

刷卡数据

GPS样例数据

车辆到离站数据


6、全量OD数据

数据描述:上海市区不同交通载体的OD数据,时间为2025年2月份

数据字段

序号 字段名称 类型 描述
1 ds string 日期,格式为YYYYMMDD
2 o_adcode string 起点城市代码区县级
3 d_adcode string 终点城市代码区县级
4 source_grid string 起点网格ID(100米、500米、1公里)
5 target_grid string 终点网格ID(100米、500米、1公里)
6 o_x string 起点坐标(网格中心点x)
7 o_y string 起点坐标(网格中心点y)
8 d_x string 终点坐标(网格中心点x)
9 d_y string 终点坐标(网格中心点y)
10 o_time string 开始时间,间隔为15分钟
11 d_time string 结束时间,间隔为15分钟
12 travel_mode string 出行方式,未知是无法识别的方式
13 duration string 出行时间
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐