1、librosa算是一个比较全面的音频处理库,可以用于音频读取、音频播放、时频转换、滤波、特征提取、计算歌曲节拍、相似度计算、绘制mel频谱等等,算是一个功能完备而使用方便的库。

使用说明:https://blog.csdn.net/zzc15806/article/details/79603994
官方文档:http://librosa.github.io/librosa/index.html

2、pyworld是一个高性能的声码器,用于将一段speech音频分离成基频(f0)、谐波谱包络和非周期谱包络,可以有效地将音频(比如人的歌声)的基频提出或者计算调式。

文档:https://github.com/JeremyCCHsu/Python-Wrapper-for-World-Vocoder
参考博客:

https://zhuanlan.zhihu.com/p/76704615
https://www.sohu.com/a/219420730_723464

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐