KITTI数据集介绍

  Kitti数据集是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达15辆车和30个行人,还有各种程度的遮挡与截断。
在这里插入图片描述

KITTI数据集采集平台

  KITTI数据集的数据采集平台装配有2个灰度摄像机,2个彩色摄像机,一个Velodyne64线3D激光雷达,4个光学镜头,以及1个GPS导航系统。
在这里插入图片描述
相机、激光雷达、IMU坐标系的方向分别为:

  • 相机:x 轴向右,y 轴向下,z 轴向前
  • Velodyne(激光雷达):x 轴向前,y 轴向左,z轴向上
  • GPS / IMU:x 轴向前,y 轴向左,z 轴向上

KITTI标定文件介绍

一个典型的标定文件如下所示:
在这里插入图片描述

  • 0、1、2、3分别代表左边灰度相机、右边灰度相机、左边彩色相机和右边彩色相机
  • P0, P1, P2, P3 分别代表对应的相机内参矩阵, 大小为 3x4
  • R0_rect 为0号相机的修正矩阵
  • Tr_velo_to_cam 为velodyne到camera的矩阵 大小为3x4,包含了旋转矩阵 R 和 平移向量 t

要将Velodyne激光雷达坐标系中的点x投影到左侧的彩色图像中y,使用公式:

y = P2 * R0_rect *Tr_velo_to_cam * x

  上面公式的意思是:将Velodyne坐标中的点x投影到编号为0的相机(参考相机)坐标系中,再修正,然后投影到编号为2的相机(左彩色相机)

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐