中值频率平衡:图像分割中一种定量计算类别权重的方法（segnet）

在多数情况下，图像分割都会遇到类别不均衡的情况，这时候需要通过权重参数来调节各类之间的比重，一般不同类别的权重占比需要通过多次实验调整，这里介绍一种计算类别的权重占比的方法:中值频率平衡，实际应用时还需要在这个基础上做微调。计算原理代码import osimport cv2import numpy as nplabel_dir = r"D:\data\RS\correct20201010\clip

mjiansun

732人浏览 · 2021-08-31 17:02:22

mjiansun · 2021-08-31 17:02:22 发布

在多数情况下，图像分割都会遇到类别不均衡的情况，这时候需要通过权重参数来调节各类之间的比重，一般不同类别的权重占比需要通过多次实验调整，这里介绍一种计算类别的权重占比的方法:中值频率平衡，实际应用时还需要在这个基础上做微调。

计算原理

å¨è¿éæå¥å¾çæè¿°

代码

import os
import cv2
import numpy as np

label_dir = r"D:\data\RS\correct20201010\clip_512_1024\train\label"

n_classes=3
count = np.zeros(n_classes)
image_count=np.zeros(n_classes)
images=os.listdir(label_dir)
for image in images:
    label_img = os.path.join(label_dir,image)
    print(label_img)

    data =cv2.imdecode(np.fromfile(label_img,dtype=np.uint8),-1)

    for c in range(n_classes):
        # count[c]+=np.sum(data==c)
        c_sum = np.sum(data==c)  #统计c类像素的个数
        count[c]+=c_sum
        if  np.sum(data==c)!=0:  #判断该图片中是否存在第c类像素，如果存在则第c类图片个数+1
            image_count[c]+=1

#各类像素占总像素数的比例
print("每一类的像素数：",count)
print("像素总个数",np.sum(count))
print("每一类像素数占总像素数的比值",(count/np.sum(count)))

#中值频率平衡
print("包含每一类像素的图片个数:",image_count)
frequency=count/(image_count*512*512)     #图片大小为512*512
print("像素出现频率",frequency)
median=np.median(frequency)
weight=median/frequency
print("每一类的权重",weight)

参考

1、《Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture》
2、《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。