研究背景

现有的方法往往局限于特定的监督场景,难以适应现实世界制造过程中遇到的多样化数据标注,如无监督、弱监督、混合监督和全监督设置。

SuperSimpleNet能够统一各种监管模式,同时保持出色的速度和可靠性,在解决现实世界的制造挑战和弥合学术研究与工业应用之间的差距方面代表了一个有前途的进步

创新点

统一四种监督场景东西异常检测

  1. 改进的合成异常生成:提出了一种新颖的合成异常生成过程,该过程在无监督的场景中显著增强了训练,并在像素级注释有限或没有的情况下促进了有效的训练。这种创新还加强了分割能力,在传统方法常常难以处理的情况下,能够实现稳健和可靠的预测。
  2. 有效的分类头:设计了一个简单但高效的分类头,它能够捕获图像的全局上下文,并能够有效地利用图像级的注释。这样的加入增强了模型处理多种类型标注数据的能力,提高了模型的适应性。
  3. 所有监督范式的统一模型:通过将来自不同监督层次的技术和见解集成到一个架构中,我们提出了一个统一的方法,以促进跨机制的知识转移。这显著提高了缺陷检测和异常分割的性能,为实际工业挑战提供了一个通用的、可扩展的解决方案。

核心思路

综合异常生成机制

新的合成异常生成使模型能够在所有四种监督机制中进行训练,同时能够在没有任何可用的标记数据的情况下学习异常分割

它不是在原始图像上进行简单的“剪切-粘贴”,而是在深度特征空间中,通过添加由柏林噪声(Perlin Noise)引导的高斯噪声来模拟各种形态各异的异常

F 通用特征(主要用于分类头)

A 分割适配特征 (主要用于分割头)

Mgt 真实的像素级缺陷掩码(无监督或弱监督情况下为空)

Mp 柏林噪声二值化后得到的掩码

Msynth 合成掩码

M 训练目标掩码(合并真实异常掩码和生成异常掩码)

PF 扰动适应特征图

PA 扰动特征图

高斯噪声限定在Msynth区域内,得到ε

将ε添加到F和A中,得到扰动特征图PA和扰动适应特征图PF

这种方式保证生成的异常更真实

保留了SimpleNet中的特征复制机制,但按照前面描述的过程对原始特征和复制后的特征都施加了噪声。这使得训练变得稳定,因为模型在每个批次中暴露于更多种类的异常

分割检测模块

分割头部首先生成异常图Mo。然后将该图与特征图F (或者在训练过程中加入噪声增强的特征图PF)进行级联,并作为分类头的卷积块的输入。将卷积块的输出和异常图进行池化、级联,并通过最终的全连接层,产生图像级的异常分数。

设计的简单性对于在无监督和有监督的环境中实现良好的性能非常重要,在提供足够的判别力的同时最小化过拟合的风险。此外,双分支设计非常适合混合监督,因为网络只需要图像级别的标签就可以进行有效的训练。

损失函数

分割头损失采用L1 loss+focal loss

L1t为所有元素的损失lij的平均值

Dseg为分割头,Pij为该处值

γ项使混合监督学习成为可能

使用分割损失加权来强调异常区域中心的像素,同时减少对更不确定的边界像素的关注。这些权重是通过对真值掩码施加距离变换而产生的,然后简单地乘以损失

分类损失的监督信号为图像级标签y(y=1表示有异常,y=0表示正常)

网络架构

输入图像
→ WideResNet50 提取特征
→ 上采样 + 拼接 + 上下文增强
→ 特征适配(分割专用)
→(训练时)合成异常生成 + 特征扰动
分割头(输出异常掩码)
分类头(结合分割结果和特征,输出异常分数)
→ 损失函数联合优化(支持无监督/弱监督/混合/全监督)
→ 推理时直接输出 掩码 + 异常分数

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐