在多数情况下,图像分割都会遇到类别不均衡的情况,这时候需要通过权重参数来调节各类之间的比重,一般不同类别的权重占比需要通过多次实验调整,这里介绍一种计算类别的权重占比的方法:中值频率平衡,实际应用时还需要在这个基础上做微调。

计算原理

å¨è¿éæå¥å¾çæè¿°

 

 代码

import os
import cv2
import numpy as np

label_dir = r"D:\data\RS\correct20201010\clip_512_1024\train\label"

n_classes=3
count = np.zeros(n_classes)
image_count=np.zeros(n_classes)
images=os.listdir(label_dir)
for image in images:
    label_img = os.path.join(label_dir,image)
    print(label_img)

    data =cv2.imdecode(np.fromfile(label_img,dtype=np.uint8),-1)

    for c in range(n_classes):
        # count[c]+=np.sum(data==c)
        c_sum = np.sum(data==c)  #统计c类像素的个数
        count[c]+=c_sum
        if  np.sum(data==c)!=0:  #判断该图片中是否存在第c类像素,如果存在则第c类图片个数+1
            image_count[c]+=1

#各类像素占总像素数的比例
print("每一类的像素数:",count)
print("像素总个数",np.sum(count))
print("每一类像素数占总像素数的比值",(count/np.sum(count)))

#中值频率平衡
print("包含每一类像素的图片个数:",image_count)
frequency=count/(image_count*512*512)     #图片大小为512*512
print("像素出现频率",frequency)
median=np.median(frequency)
weight=median/frequency
print("每一类的权重",weight)

参考

1、《Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale Convolutional Architecture》
2、《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐