这里有篇论文《基于子带谱平滑度的音频篡改检测》,可供参考。

这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。

大部分假无损就是上采样为高质量的音频,然后用无损格式封装。

11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。

22050Hz原始音频,一般情况下是自然逐步衰减(这取决与音频的内容,也有例外)

最后用各种分类器,足以检测出上采样的音频。

 

转载于:https://www.cnblogs.com/welen/p/4456533.html

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐