该数据集提供了带注释的热成像数据集和对应的无注释RGB图像,用于训练和验证神经网络。

数据集总共包含14452张红外图像,其中10228张来自多个短视频;4224张来自一个长为144s的视频。所有视频都来自街道和高速路。大多数图片的采样率为1秒两帧,其中视频的帧率为1秒30帧;少数环境中目标较少时,采样率为1秒1帧。

train文件夹

文件名 注释
Annotated_thermal_8_bit 带标注框的红外图像
RGB 不带标注框RGB图像
thermal_8_bit 不带标注框红外图像
thermal_16_bit tiff文件
thermal_annotations.json 标注的json文件

JSON文件详解

第一部分

  "info": {
    "version": 1.0,
    "url": "no url specified",
    "year": 2019,
    "date_created": "today",
    "contributor": "no contributor specified",
    "description": ""
  },

含义:文件开头 有关的版本信息、时间啥的

第二部分

"categories": [
    {
      "name": "person",
      "id": 1,
      "supercategory": "unknown"
    },
    {
      "name": "bicycle",
      "id": 2,
      "supercategory": "unknown"
    },
    ···
        {
      "name": "empty",
      "id": 0,
      "supercategory": "unknown"
    }
    }

含义:定义标签及标签ID,这里用的是coco一样的不过这个数据集只对五类进行了标注:

  • 类别 1:People
  • 类别 2:Bicycle —— 自行车和摩托车(与coco不一致)
  • 类别 3:Cars ——私人汽车或者其他小型商用汽车。
  • 类别 18:Dogs
  • 类别 91:其他汽车 —— 大型卡车,船,拖车

第三部分:数据部分–也是用到的部分

"licenses": [],
  "annotations": [
    {
      "image_id": 0,-----------------------------图片id
      "extra_info": {-----------------------------额外信息
        "human_annotated": true-----------人工标注:true
      },
      "category_id": 3,---------------------类别id,就是所标注的类对应的id
      "iscrowd": 0,-------------0表示标注一个对象,segmentation格式使用polygons,1表示标注多个对象,segmentation格式使用RLE格式
      "id": 1,----------------------------------第几个框
      "segmentation": [--框的四个点坐标
        [
          202,
          190,
          202,
          312,
          334,
          312,
          334,
          190
        ]
      ],
      "bbox": [-----框的x,y,h,w  左上角第一个坐标和框的长,宽
        202,
        190,
        132,
        122
      ],
      "area": 16104-----------标注面积
    },

在这里插入图片描述

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐