基于非负矩阵分解的多视图学习——潜在语义感知的多视图多标签学习方法（Latent Semantic-aware Multi-view Multi-label Learning, 简称 LSVML）

潜在语义感知的多视图多标签学习方法（Latent Semantic-aware Multi-view Multi-label Learning, 简称 LSVML）是一种用于处理包含多个特征视图和多个标签的数据集的机器学习技术。这类方法特别适用于，其中数据可以从多个角度（视图）进行描述，并且可以属于多个类别（多标签）。

不易撞的网名

1067人浏览 · 2024-07-11 14:34:44

不易撞的网名 · 2024-07-11 14:34:44 发布

潜在语义感知的多视图多标签学习方法（Latent Semantic-aware Multi-view Multi-label Learning, 简称 LSVML）是一种用于处理包含多个特征视图和多个标签的数据集的机器学习技术。

这类方法特别适用于文本、图像和其他复杂数据类型，其中数据可以从多个角度（视图）进行描述，并且可以属于多个类别（多标签）。

核心思想

LSVML 方法利用潜在语义分析（LSA）或类似的技术来捕获数据中的隐藏结构，并将其应用于多视图和多标签的学习场景中。

LSA 或 LDA（潜在狄利克雷分配）可以帮助识别数据中的主题或概念，而多视图学习则考虑了数据的多个表示或视角，以获得更全面的理解。

多标签学习允许每个样本可以被分配多个标签，这在现实世界的数据集中很常见。

目标函数

LSVML 的目标函数可能会结合多视图的表示和多标签的预测，同时考虑到潜在语义结构。一个可能的目标函数可以表示为：

$\min_{\mathbf{W}, \mathbf{H}, \mathbf{Y}} \sum_{v=1}^V \left\| \mathbf{X}_v - \mathbf{X}_v \mathbf{W}_v \mathbf{H} \right\|_F^2 + \lambda \left\| \mathbf{Y} - \mathbf{H} \mathbf{B} \right\|_F^2 + \gamma \Omega(\mathbf{H})$

其中，

$Xv\mathbf{X}_v$ 是第 $v$ 视图的数据矩阵。
$Wv\mathbf{W}_v$ 和 $H\mathbf{H}$ 分别是第 $v$ 视图的权重矩阵和共享的潜在语义矩阵。
$Y\mathbf{Y}$ 是多标签的预测矩阵。
$B\mathbf{B}$ 是连接潜在语义矩阵和标签矩阵的转换矩阵。
$∥⋅∥F\left\| \cdot \right\|_F$ 表示 Frobenius范数，用于度量矩阵之间的差异。
$λ\lambda$ 和 $γ\gamma$ 是正则化参数，用于平衡不同部分的损失。
$Ω(H)\Omega(\mathbf{H})$ 是针对 $H\mathbf{H}$ 的正则化项，如稀疏性或低秩性，以控制潜在语义矩阵的复杂度。

公式解释

$Xv\mathbf{X}_v$ ：表示第 $v$ 视图的数据矩阵，尺寸为 $\times M_v$ ，其中 $N$ 是样本数量， $M_v$ 是第 $v$ 视图的特征数量。
$Wv\mathbf{W}_v$ ：是第 $v$ 视图的权重矩阵，尺寸取决于 $Xv\mathbf{X}_v$ 和 $H\mathbf{H}$ 的维度，用于从 $Xv\mathbf{X}_v$ 到 $H\mathbf{H}$ 的转换。
$H\mathbf{H}$ ：共享的潜在语义矩阵，尺寸为 $\times K$ ，其中 $K$ 是潜在语义的数量。
$Y\mathbf{Y}$ ：预测的标签矩阵，尺寸为 $\times L$ ，其中 $L$ 是可能的标签数量。
$B\mathbf{B}$ ：转换矩阵，尺寸为 $\times L$ ，用于从潜在语义空间到标签空间的转换。
$∥Xv−XvWvH∥F2\left\| \mathbf{X}_v - \mathbf{X}_v \mathbf{W}_v \mathbf{H} \right\|_F^2$ ：表示原始数据矩阵 $Xv\mathbf{X}_v$ 和通过 $Wv\mathbf{W}_v$ 和 $H\mathbf{H}$ 重构的数据之间的 Frobenius 范数误差。
$∥Y−HB∥F2\left\| \mathbf{Y} - \mathbf{H} \mathbf{B} \right\|_F^2$ ：表示预测的标签矩阵 $Y\mathbf{Y}$ 和从潜在语义矩阵 $H\mathbf{H}$ 通过转换矩阵 $B\mathbf{B}$ 得到的预测之间的误差。
$Ω(H)\Omega(\mathbf{H})$ ：正则化项，用于控制 $H\mathbf{H}$ 的复杂度，保证模型的泛化能力和避免过拟合。

求解方法

求解 LSVML 的目标函数通常涉及优化算法，如梯度下降、交替最小二乘法（ALS）或其他适当的迭代优化方法。

在每轮迭代中，算法会交替地更新 $Wv\mathbf{W}_v$ 、 $H\mathbf{H}$ 和 $Y\mathbf{Y}$ ，直到达到收敛或满足某个停止准则。

应用场景

LSVML 方法在多种应用场景下非常有用，包括但不限于：

文本分类：在新闻文章或学术论文中识别多个主题或标签。
图像注释：为图像添加多个描述性标签，如“风景”、“人物”、“城市”等。
推荐系统：为用户推荐多个可能感兴趣的商品或服务。
生物信息学：对基因表达数据进行多标签分类，以识别多个生物学过程或疾病状态。

通过利用潜在语义结构和多视图信息，LSVML 方法能够提高模型的预测精度和鲁棒性，尤其是在处理复杂和高维数据时。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。