1.问题:大多数现有方法的视觉表征受到短期观察序列的限制,不能为实现合理的检测提供足够的线索。短期观测噪声[28]会导致不正确和反事实的姿态估计
在不规则运动模式上比在正常运动模式上产生更大的误差。
方法:通过学习长期序列来完全表示物体的运动模式。我们所提出的方法处理的是时变概率分布的高维视频数据。提出了一种基于状态机的方法来获得可推广到长期时间变化的一
致运动模式。
准确率82%
2.在线异常检测
问题:
在简单场景下效果良好,但在复杂的运动场景下往往存在检测率低、虚警率高的问题。
由于异常有很多种类型,并且不能全部人工标记,所以异常检测方法转向无监督学习方法。
异常事件的及时定位也是未来研究的发展方向。这不仅涉及到对异常事件本身的检测和定位,还涉及到对异常事件发生时间的准确检测。
现有方法在 UCF-crime 和 DOTA 数据集上的 AUC 普遍较低,可能是因为这些数据集的场景相对复杂,变化和噪声较多
3.新论文
10.1109/TCSVT.2022.3227716--基于重构Boosting Variational Inference With Margin Learning for Few-Shot Scene-Adaptive Anomaly Detection

10.1007/s11042-023-16193-0--基于预测A data-driven approach for road accident detection in surveillance videos
3.现有的方法假设训练视频和测试视频来自同一个场景,当遇到不可见的场景时,泛化性能较差。

上海科技大学数据集进行训练时AUC:

UCSD Ped2:93%-95%

CUHK avenue:80%-82%

UR Fall:83%-86%

在使用UCF CRIME数据集进行训练时,与Lu等人[6]的模型性能比较。我们计算了在UCSD PED2、CUHK AVENUE和UR FALL数据集上的平均AUC(百分比)。

 UCSD ped2:88%-90%

CUHK :80%-81%

UR Fall:82%-87%

首先,提出了一种新的变分正态推理(VNI)模块,用于在条件变分自编码器(CVAE)框架中进行图像重构,该框架学习概率决策模型而不是传统的确定性决策模型。其次,利用边际学习嵌入(MLE)模块来增强变分推理并帮助区分正常事件。我们从理论上证明了最小化MLE模块中的三重态损失有助于最大化CVAE的证据下界(ELBO),从而促进VNI的收敛。通过将变分推理与边际学习相结合。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐