2025深度学习发论文&模型涨点之——工业异常检测

工业异常检测是指在工业生产过程中,通过监测和分析生产系统的数据,识别出与正常生产模式显著偏离的异常行为或事件的过程。这些异常可能包括设备故障、质量缺陷、生产效率下降、安全问题等。工业异常检测的目的是尽早发现这些问题,以便及时采取措施,减少损失,提高生产效率和产品质量。

我整理了一些工业异常检测【论文+代码】合集

论文精选

论文1:

[CVPR] Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping

通过跨模态特征映射实现多模态工业异常检测

方法

跨模态特征映射:学习将一个模态的特征映射到另一个模态的特征,通过比较实际特征和预测特征之间的不一致性来检测异常。

轻量级神经网络:使用小而浅的多层感知机(MLP)实现特征映射函数,以实现快速推理和有限的内存占用。

层剪枝技术:通过剪枝特征提取器的深层,进一步减少内存需求和提高推理速度。

图片

创新点

提出了一种新的无监督多模态异常检测框架:通过跨模态特征映射来检测异常,在MVTec 3D-AD数据集上实现了最先进的检测和分割性能。

通过避免显式嵌入到Krein空间和基于特征分解的构建新的内积,提高了算法的计算效率:与之前的多模态异常检测方法相比,该方法更快,占用内存更少。

提出了一种网络剪枝策略:通过牺牲少量性能来显著提高推理速度和减少内存占用。例如,剪枝后的“Tiny”架构运行速度几乎是原始模型的两倍,同时在AUPRO@1%指标上达到了0.419的性能。

图片

论文2:

[CVPR] Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation

文本引导的变分图像生成用于工业异常检测与分割

方法

关键词到提示生成器:通过比较通过广泛文本库文档学习的目标对象的文本信息与输入图像,生成最佳提示。

变分图像生成器:生成与输入图像相似的无缺陷数据图像,确保生成的无缺陷图像与从文本和图像知识推导出的预期分布一致。

文本引导的知识整合:将潜在图像特征与目标对象的文本信息对齐,以弥合不同模态之间的语义差距。

图片

创新点

首次提出基于变分图像生成器的框架:用于预测和保持提供的无缺陷图像的方差,在只有单个或少数无缺陷图像的情况下,也能超越以往方法。

开发了关键词到提示生成器:通过比较通过广泛文本库文档学习的目标对象的文本信息与输入图像,生成最佳提示。

提出了文本引导的知识整合方法:将潜在图像特征与目标对象的文本信息对齐,以弥合不同模态之间的语义差距。

在多个真实世界的工业数据集上验证了方法的有效性:即使在只有单个或少数无缺陷图像的情况下,也能超越以往方法。

图片

论文3:

[ICCV] FastRecon: Few-shot Industrial Anomaly Detection via Fast Feature Reconstruction

FastRecon:快速特征重建用于少样本工业异常检测

方法

特征提取和核心集选择:使用预训练的ResNet-50提取图像的特征图,并通过贪婪核心集采样减少数据冗余。

回归与分布正则化:提出一种回归算法,通过分布正则化找到从支持特征到查询特征的最佳变换。

异常检测与重建:通过比较原始查询样本和重建的正常版本之间的差异来检测异常。

图片

创新点

提出了一种少样本且类别无关的工业异常检测策略:通过比较原始测试样本和重建的正常版本之间的差异来检测异常。

提出了一种具有闭式解的回归算法:该算法通过分布正则化来估计从支持特征到查询特征的最佳变换,确保重建结果与查询图像在视觉上相似,同时保持正常样本的特性。

在多个基准数据集和设置下,该方法实现了少样本异常检测的最新性能:在MVTec 3D-AD数据集上,与之前的最佳方法相比,图像级AUROC提升了5.27%,像素级AUROC提升了6.04%。

图片

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐