kitti数据集label解析和可视化教程

weixin_44767160

2583人浏览 · 2022-05-07 09:22:11

weixin_44767160 · 2022-05-07 09:22:11 发布

kitti数据集label解析_hhhhhhzb的博客-CSDN博客_kitti数据集label其中第1列truck 表示图中出现了卡车（一共有’Car’, ‘Van’, ‘Truck’,‘Pedestrian’, ‘Person_sitting’, ‘Cyclist’, ‘Tram’,‘Misc’ or 'DontCare’这些类别，Don’t care 是没有3D标注的，原因是雷达扫不了那么远，即使可以视觉检测出来）第2列0.0表示其是否被截断的程度为0。（如果车在图片边缘，那么就有可能发生部分被截断的情况。用0-1 表示被截断的程度。）第3列0表示没有被遮挡。（0表示完全可见，1表示部分遮.https://blog.csdn.net/hhhhhhzb/article/details/117913706

KITTI数据集--参数_jilijilicao的博客-CSDN博客_kitti一、kitti数据集，label解析 16个数代表的含义：第1个字符串：代表物体类别'Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram', 'Misc' or 'DontCare'注意，’DontCare’ 标签表示该区域没有被标注，比如由于目标物体距离激光雷达太远。为了防止在评估过...https://blog.csdn.net/cuichuanchen3307/article/details/80596689?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1-80596689-blog-117913706.pc_relevant_antiscanv2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2~default~CTRLIST~Rate-1-80596689-blog-117913706.pc_relevant_antiscanv2&utm_relevant_index=2

KITTI自动驾驶数据集可视化教程_自动驾驶小学生的博客-CSDN博客_kitti可视化https://blog.csdn.net/cg129054036/article/details/119516704

<center>Kitti数据集相应参数说明</center>

1、数据的制作设备及一些参数说明：

1）4路相机：

camera_0：左边灰度相机，参考相机

camera_1：右边灰度相机

camera_2：左边彩色相机

camera_3：右边彩色相机

2）一个激光雷达：用于生成点云数据

3）camera_0与camera_2、camera_1与camera_3的距离为0.06米

4）camera_0与camera_1、camera_2与camera_3的距离为0.54米

5）4路相机的高度都为1.65米

6）激光雷达的高度为1.73米

7）坐标系说明：

相机坐标系： x = right, y = down, z = forward

点云坐标系： x = forward, y = left, z = up

2、数据文件解释

2.1 label txt

1）第1个值：代表类别，可以为['Car', 'Van', 'Truck','Pedestrian', 'Person_sitting', 'Cyclist','Tram', 'Misc' , 'DontCare']

2）第2个值：代表物体是否被截断，从0到1浮动，0表示没被截断，1表示完全被截断，即超出图像范围

3）第3个值：代表物体是否被遮挡，表示为整数0（完全可见）、1（小部分遮挡）、2（大部分遮挡）、3（完全遮挡）

4）第4个值：代表物体的观察角度，可参考这篇博客的解释

5）第5～8个值：代表物体的2D bounding box，分别为xmin、ymin、xmax、ymax

6）第9～11个值：代表物体的高宽长(hwl)（单位：米）

7）第12～14个值：代表3D bounding box的中心坐标（相机坐标系下）

2.2 point cloud file

一个bin文件为一张图像的相应点云，保存为Nx4的形式，4为(x, y, z, ref)，x, y, z为相应的坐标（点云坐标系下），ref为反射率

2.3 calib txt

1）P0：3x4，3x3为相机内参，最后一列为全0，对P0来说无意义

2）P1：3x4，3x3为相机内参，该矩阵为校准后的camera_0相机坐标到camera_1图像坐标的映射

3）P2：3x4，3x3为相机内参，该矩阵为校准后的camera_0相机坐标到camera_2图像坐标的映射

4）P3：3x4，3x3为相机内参，该矩阵为校准后的camera_0相机坐标到camera_3图像坐标的映射

5）R0_rect：3x3，参考坐标的校准旋转矩阵。校准是使多路相机的图像在同一个平面上

6）Tr_velo_to_cam：点云坐标到参考坐标（即camera_0坐标系）的映射矩阵

示例：

1、将label文件中的3D bounding box转换到图像坐标（以映射到左彩图为例）：

y_image = P2 * R0_rect * R0_rot * x_ref_coord

注：R0_rot为物体坐标到参考坐标的映射矩阵

2、将点云坐标映射到图像坐标（以映射到左彩图为例）：

y_image = P2 * R0_rect * Tr_velo_to_cam * x_velo_coord

参考连接：

1、博客https://medium.com/test-ttile/kitti-3d-object-detection-dataset-d78a762b5a4

2、kitti官方论文http://ww.cvlibs.net/publications/Geiger2013IJRR.pdf

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

告别画图时的文字乱码！基于昇腾玩转文生图模型Qwen-Image

魔乐社区

基于昇腾玩转电影级视频生成模型Wan 2.2

魔乐社区

支持轻量化部署的混元3D世界模型Lite版本上线魔乐社区，昇腾部署实践来啦

魔乐社区

所有评论(0)

查看更多评论

weixin_44767160

@weixin_44767160

已为社区贡献2条内容