这里有篇论文《基于子带谱平滑度的音频篡改检测》,可供参考。
这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。
大部分假无损就是上采样为高质量的音频,然后用无损格式封装。
11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。

22050Hz原始音频,一般情况下是自然逐步衰减(这取决与音频的内容,也有例外)

最后用各种分类器,足以检测出上采样的音频。
这里有篇论文《基于子带谱平滑度的音频篡改检测》,可供参考。这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。大部分假无损就是上采样为高质量的音频,然后用无损格式封装。11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。22050Hz原始音频,一般情况下是自然逐步衰减(这取决与音频的内容,也有例外)...
这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。
大部分假无损就是上采样为高质量的音频,然后用无损格式封装。
11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。

22050Hz原始音频,一般情况下是自然逐步衰减(这取决与音频的内容,也有例外)

最后用各种分类器,足以检测出上采样的音频。
转载于:https://www.cnblogs.com/welen/p/4456533.html
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)