图像是由像素按照行和列的网格排序组成的二维矩阵。像素是图像的最小单位,每个像素包含颜色信息RGB,Red红色,green (绿色)B(blue)蓝色,每个像素的颜色由这三个分量的强度决定,每个分量的强度值可以是从0到255的整数,分别代表0%到100%的亮度。每个像素都对应于图像上的一个特定位置,像素的大小决定了图像的分辨率。分辨率越高,图像越清晰,每个像素代表的区域就越小。

  • RGB (255, 0, 0) 表示纯红色,因为红色分量的强度是255,而绿色和蓝色分量的强度是0。
  • RGB (0, 255, 0) 表示纯绿色,因为绿色分量的强度是255,而红色和蓝色分量的强度是0。
  • RGB (0, 0, 255) 表示纯蓝色,因为蓝色分量的强度是255,而红色和绿色分量的强度是0

调整图像的亮度、对比度、饱和度等都是通过对每个像素的颜色值进行操作来实现的。

图片采集方法通常分为实时采集和非实时采集,实时采集的有传感器(如摄像头、扫描仪、传感器网络等),卫星遥感采集,非实时采集的有扫描仪、无人机拍摄、3d扫描、图像处理软件。

图像数据标注类型:

  1. 关键点标注

    • 在关键点标注中,标注者需要在图像中标识出对象的关键点,如人的眼睛、鼻子、耳朵等。这些关键点有助于后续的识别和跟踪任务。
  2. 矩形框标注

    • 矩形框标注是标注对象边界框的一种常见方式。标注者需要在图像中为每个对象绘制一个矩形框,以准确地标识出对象的位置和大小。
    • 矩形框的大小应该根据目标对象的实际大小来调整,以确保模型能够准确地识别和分类对象
  3. 图像分割

    • 图像分割是将图像分割成多个区域或像素块,每个块都与图像中的一个对象或对象的一部分相对应。这种标注方法通常用于语义分割和实例分割任务。
    • 图像的语义分割(Semantic Segmentation)可以简单地理解为“像素分类”。在图像的语义分割任务中,模型的目标是为图像中的每个像素点分配一个类别标签,这通常对应于图像中的对象、地面、天空等不同部分
  4. 3D框标注

    • 在3D框标注中,标注者需要为图像中的对象提供三维空间中的位置和尺寸信息。这通常涉及为对象绘制一个包围盒,并为其添加高度、宽度、深度等3D信息。
  5. 属性标注

    • 属性标注涉及为图像中的对象或场景添加额外的描述性信息,如颜色、类别、方向等。这种标注方法有助于模型学习对象的特征和属性。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐