经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)
多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)是一种用于处理和分析来自不同视角或模态的数据的技术。它特别适用于处理多模态数据集,例如,从文本、图像、视频、音频等多种来源收集的数据。MVDA的,使得不同模态或视图的数据在该表示下能够更好地分离不同的类别。
多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)是一种用于处理和分析来自不同视角或模态
的数据的技术。
它特别适用于处理多模态数据集
,例如,从文本、图像、视频、音频等多种来源收集的数据。
MVDA的目标是找到一个低维的公共表示
,使得不同模态或视图的数据在该表示下能够更好地分离不同的类别。
MVDA的核心思想
MVDA试图在多个视图之间找到一种联合
的表示,这种表示能够在不同视图间保持数据的内在结构和关系
,同时增强不同类别的可分性
。
在最简单的形式下,MVDA可以被视为多视图线性鉴别分析(Multi-View Linear Discriminant Analysis, MV-LDA)的推广
,但更广泛的MVDA框架可以包括非线性映射和其他更复杂的模型。
公式和解释
让我们以MV-LDA为例,来探讨多视图鉴别分析的基本原理和公式。在MV-LDA中,我们考虑了两个主要矩阵:类内
散度矩阵 SwS_wSw 和类间
散度矩阵 SbS_bSb。
类内散度矩阵 SwS_wSw
类内
散度矩阵描述了同一类别
内部样本的分布情况,我们希望这个矩阵越小越好,意味着同一类内的样本越接近。
Sw=∑i=1VSw(i)S_w = \sum_{i=1}^{V} S_w^{(i)}Sw=i=1∑VSw(i)
其中 VVV 是视图的总数
,Sw(i)S_w^{(i)}Sw(i) 是第 iii 个视图的类内
散度矩阵。
对于第 iii 个视图:
Sw(i)=∑c=1C∑xj(i)∈c(xj(i)−μc(i))(xj(i)−μc(i))T S_w^{(i)} = \sum_{c=1}^{C} \sum_{x_j^{(i)} \in c} (x_j^{(i)} - \mu_c^{(i)}) (x_j^{(i)} - \mu_c^{(i)})^T Sw(i)=c=1∑Cxj(i)∈c∑(xj(i)−μc(i))(xj(i)−μc(i))T
- CCC 是
类别数
; - xj(i)x_j^{(i)}xj(i) 是第 iii 视图中第 jjj 个
样本
; - μc(i)\mu_c^{(i)}μc(i) 是第 iii 视图中第 ccc 类的
样本均值向量。
类间散度矩阵 SbS_bSb
类间散度矩阵则描述了不同类别之间的分布情况,我们希望这个矩阵越大越好,意味着不同类别的样本在低维空间中更易于区分。
Sb=∑i=1VSb(i)S_b = \sum_{i=1}^{V} S_b^{(i)} Sb=i=1∑VSb(i)
对于第 iii 个视图:
Sb(i)=∑c=1CNc(μc(i)−μ(i))(μc(i)−μ(i))T S_b^{(i)} = \sum_{c=1}^{C} N_c (\mu_c^{(i)} - \mu^{(i)}) (\mu_c^{(i)} - \mu^{(i)})^TSb(i)=c=1∑CNc(μc(i)−μ(i))(μc(i)−μ(i))T
- NcN_cNc 是第 ccc 类的
样本数;
- μ(i)\mu^{(i)}μ(i) 是第 iii 视图的
所有样本的总均值向量。
最终目标
MV-LDA的目标是找到一个投影矩阵
WWW ,使得投影后的数据在类间
差异最大化,同时类内
差异最小化。这可以通过最大化
下面的目标函数来实现:
J(W)=tr(WTSbW)tr(WTSwW)J(W) = \frac{\text{tr}(W^T S_b W)}{\text{tr}(W^T S_w W)} J(W)=tr(WTSwW)tr(WTSbW)
其中:
- tr\text{tr}tr 表示矩阵的
迹(即对角线元素的和)
。
求解
为了求解 WWW,我们通常会构造一个拉格朗日乘子
问题,然后求解广义特征值问题:
SbW=λSwWS_b W = \lambda S_w WSbW=λSwW
其中 λ\lambdaλ 是特征值,WWW 是特征向量。
通过求解这个广义特征值问题,我们可以找到最佳的投影矩阵
WWW,进而得到多视图数据的低维表示。
小结
多视图鉴别分析是一种强大的工具,用于处理多模态数据,它能够有效地融合
来自不同视图的信息,提高分类和识别的性能。
通过优化类内和类间
散度矩阵的比例,MVDA能够找到一个能够最好地区分不同类别的投影方向。

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)