kitti数据集label解析和可视化教程
kitti数据集label解析_hhhhhhzb的博客-CSDN博客_kitti数据集label其中第1列truck 表示图中出现了卡车(一共有’Car’, ‘Van’, ‘Truck’,‘Pedestrian’, ‘Person_sitting’, ‘Cyclist’, ‘Tram’,‘Misc’ or 'DontCare’这些类别,Don’t care 是没有3D标注的,原因是雷达扫不了那么远
<center><font size=6 face="黑体">Kitti数据集相应参数说明</font></center>
1、数据的制作设备及一些参数说明:
1)4路相机:
camera_0:左边灰度相机,<font color='red'>参考相机</font>
camera_1:右边灰度相机
camera_2:左边彩色相机
camera_3:右边彩色相机
2)一个激光雷达:用于生成点云数据
3)camera_0与camera_2、camera_1与camera_3的距离为0.06米
4)camera_0与camera_1、camera_2与camera_3的距离为0.54米
5)4路相机的高度都为1.65米
6)激光雷达的高度为1.73米
7)坐标系说明:
相机坐标系: x = right, y = down, z = forward
点云坐标系: x = forward, y = left, z = up
2、数据文件解释
2.1 label txt
1)第1个值:代表类别,可以为['Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram', 'Misc' , 'DontCare']
2)第2个值:代表物体是否被截断,从0到1浮动,0表示没被截断,1表示完全被截断,即超出图像范围
3)第3个值:代表物体是否被遮挡,表示为整数0(完全可见)、1(小部分遮挡)、2(大部分遮挡)、3(完全遮挡)
4)第4个值:代表物体的观察角度,可参考<font color=blue>这篇博客</font>的解释
5)第5~8个值:代表物体的2D bounding box,分别为xmin、ymin、xmax、ymax
6)第9~11个值:代表物体的高宽长(hwl)(单位:米)
7)第12~14个值:代表3D bounding box的中心坐标(相机坐标系下)
2.2 point cloud file
一个bin文件为一张图像的相应点云,保存为Nx4的形式,4为(x, y, z, ref),x, y, z为相应的坐标(点云坐标系下),ref为反射率
2.3 calib txt
1)P0:3x4,3x3为相机内参,最后一列为全0,对P0来说无意义
2)P1:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_1图像坐标的映射
3)P2:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_2图像坐标的映射
4)P3:3x4,3x3为相机内参,该矩阵为校准后的camera_0相机坐标到camera_3图像坐标的映射
5)R0_rect:3x3,参考坐标的校准旋转矩阵。校准是使多路相机的图像在同一个平面上
6)Tr_velo_to_cam:点云坐标到参考坐标(即camera_0坐标系)的映射矩阵
示例:
1、将label文件中的3D bounding box转换到图像坐标(以映射到左彩图为例):
y_image = P2 * R0_rect * R0_rot * x_ref_coord
注:R0_rot为物体坐标到参考坐标的映射矩阵
2、将点云坐标映射到图像坐标(以映射到左彩图为例):
y_image = P2 * R0_rect * Tr_velo_to_cam * x_velo_coord
参考连接:
1、博客https://medium.com/test-ttile/kitti-3d-object-detection-dataset-d78a762b5a4
2、kitti官方论文http://ww.cvlibs.net/publications/Geiger2013IJRR.pdf

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)