计算机视觉——图像分割(上篇)
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】【本章节内容针对图像分割进行讲解】接下来我们将主要针对以下内容进行介绍:早期的图像分割方法基于特定理论的方法 :Mean Shift 、Normalized Cut、Graph Cut基于深度神经网络的图像分割 :FCN、SegNet、R-CNN一.早期图像分割方法:1
【本学期选修国科大高伟老师的计算机视觉课程,本人方向也是cv,因此想通过博客方式记录课程中比较重要的点,巩固并且进行一些扩展学习】
【本章节内容针对图像分割进行讲解】
接下来我们将主要针对以下内容进行介绍:
早期的图像分割方法
基于特定理论的方法 :Mean Shift 、Normalized Cut、Graph Cut
基于深度神经网络的图像分割 :FCN、SegNet、R-CNN
一.早期图像分割方法:
1.1 阈值法
上图T值便是我们设置的阈值。
但是如果遇到灰度级集中的情况,简单的设置阈值往往达不到很好的效果。如下图左边灰度级过于集中;或者右边应为光圈问题,在后期提取情况造成了很大的偏差。

针对此,我们引入了
1.2 局部阈值法:

1.3 基于边缘的分割方法:
若此时想要利用a-b空间找到左图同时过两个点的线,可以通过右图相加的点找到对应的a0和b0来确定该条直线。
但是存在一个问题:若直线垂直于x轴,这意味着a值趋向于无穷大。
因此针对该现象,我们引入了极坐标:
其中相交的点便是我们寻找的条件。

二.基于特定理论的方法 :(Clustering聚类方法为主)
2.1 K-Means
步骤如下:
优缺点:
K-Means效果图
2.2 高斯混合模型(GMM)
其是指多个高斯分布函数的线性组合,用两个参数来描述聚类的形状:均值和标准差。 以二维分布为例,标准差的存在允许聚类的形状,相比如K-Means算法,更加灵活地对点进行分类。在图像上可表示为多类型的椭圆,而不再限制于圆形(K-Means)。
为了找到每个聚类的参数,EM算法【Wu X, Kumar V, Quinlan J R, et al. Top 10 algorithms in data mining[J]. Knowledge and information systems, 2008, 14(1): 1-37.】在这里极为重要 !


缺点:与K-Means相比,GMM每一步迭代的计算量比较大。 基于EM算法,有可能陷入局部极值,需要经过多次迭代。
2.3 Mean-Shift

【如上图绿色画圈范围中,红点所在区域密度更大,会使得该聚类点往红点迁移,直至密度不变,也就是梯度为零情况。】
优缺点:
2.4 图割
【无向图和有向图】
S-T图
【若s和t由线分割则为s-t割,反之为非s-t割】
最小割:割线所经过权值最小
2.4.1 Normalized cut(归一化分割)
简单推导可得:Ncut(A,B)=2-Nassoc(A,B)
不幸的是求一个图的Ncut是一个NP问题。

2.4.2 用graph cut求解能量极小化问题
计算机视觉的很多问题可以看作一个最优标记(labeling)问题,如:

我们构建如下能量函数来得到最优标记准则:

【Graph cut与能量函数的对应关系】
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)