【来源:卷毛的时序日记微信公众号】

在云服务监控、工业制造等领域,时间序列异常检测就像"安全卫士",能及时发现数据中的异常波动,避免重大故障。但传统方法总爱"钻牛角尖"——要么过度关注局部小波动导致误判,要么模型复杂到跑不动。

今天要给大家介绍的ICML 2025最新研究《KAN-AD: Time Series Anomaly Detection with Kolmogorov–Arnold Networks》,直接用三大创新点解决了这些痛点,一起来看看吧!

论文信息

题目:KAN-AD: Time Series Anomaly Detection with Kolmogorov–Arnold Networks
基于柯尔莫哥洛夫 - 阿诺德网络的时间序列异常检测方法KAN-AD
作者:Quan Zhou、Changhua Pei、Fei Sun、Jing Han、Zhengwei Gao、Haiming Zhang、Gaogang Xie、Dan Pei、Jianhui Li

为什么传统方法总掉链子?

先看个扎心的例子:当时间序列里混入局部峰值或下降时(比如服务器突发流量波动),像TimesNet这样的主流模型就容易"走火入魔"——把这些正常小波动当成异常,真正的异常反而漏检了。

传统模型在噪声数据上的失效

问题出在哪?作者指出:正常数据比异常数据更平滑,但传统预测模型非要"死磕"每一个细节,结果把噪声当成了规律。基于VAE的方法虽然想通过降维避免这个问题,却又容易"偷懒"导致欠拟合。

KAN-AD:给KAN换个"发动机"

受柯尔莫哥洛夫-阿诺德定理启发(任何复杂函数都能拆成简单单变量函数的组合),研究团队对KAN网络进行了三大改造:

  1. 用傅里叶级数替代B样条:傅里叶的正弦余弦波天生擅长捕捉周期性,还能过滤局部噪声
  2. 加个"放大镜"看细节:用替代索引函数弥补傅里叶高频信息的缺失
  3. 消除趋势干扰:通过差分运算让模型更专注于核心模式

一目了然的工作流程

KAN-AD的运作分三步,看完你就懂了:

KAN-AD总体架构

第一步:映射阶段——数据变变变

把原始时间窗口数据,通过三类函数转换成新特征:

  • 原始时间序列
  • 傅里叶级数(正弦+余弦波)
  • 周期增强函数(专门捕捉细微周期)

就像给数据拍了"多角度照片",确保关键特征一个都跑不掉。

第二步:归约阶段——浓缩精华

用堆叠的1D卷积层对特征进行"提纯",通过残差连接防止信息丢失,最后输出正常模式的近似值。这一步就像用滤镜把照片的关键元素凸显出来。

第三步:投影阶段——预测见分晓

用简单的线性层预测下一个时间点的数值,通过比较预测值和实际值判断是否异常。

实战成绩:赢麻了!

在KPI、TODS、WSD、UCR四个公开数据集上,KAN-AD把十种SOTA方法按在地上摩擦:

精度碾压

  • 平均Event F1分数提升15%,在TODS数据集甚至反超27%
  • 对长异常段(如UCR中300+点的异常)检测更稳定

不同数据集上的性能对比

效率感人

  • 仅需274个参数!比参数最少的TranAD还少25%
  • 推理速度比原始KAN快50%,手机都能跑

模型参数对比

鲁棒性拉满

当训练数据中异常比例增加时,LSTMAD等方法性能暴跌,而KAN-AD稳如老狗:

对异常数据的鲁棒性测试

ablation study告诉你哪个模块最关键

作者做了一组"拆零件"实验,证明每个创新都不是多余的:

  1. 常数项消除模块:对KPI、TODS这类波动大的数据集,能提升5-8%的F1分数
  2. 傅里叶级数完胜:比泰勒级数、切比雪夫多项式更适合异常检测
  3. 多特征组合才是王道:傅里叶+周期函数的组合效果远超单一特征

不同单变量函数的性能对比

不止单变量!多变量场景同样能打

把KAN-AD稍作改造(每个特征单独处理),在SMD、MSL等多变量数据集上,平均Best F1达到0.9076,参数还不到其他方法的十分之一!

写在最后

KAN-AD的成功证明:有时候"大道至简"比"叠积木"更有效。用傅里叶级数给KAN换个"发动机",居然在精度、效率、鲁棒性上全面突破。

如果你正在做异常检测相关研究,或者需要处理工业传感器、服务器监控等时间序列数据,这个方法绝对值得一试。代码已经开源(https://github.com/CSTCloudOps/KAN-AD),快去亲手试试吧!

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐