常用的音频处理库介绍

1、librosa算是一个比较全面的音频处理库，可以用于音频读取、音频播放、时频转换、滤波、特征提取、计算歌曲节拍、相似度计算、绘制mel频谱等等，算是一个功能完备而使用方便的库。使用说明：https://blog.csdn.net/zzc15806/article/details/79603994官方文档：http://librosa.github.io/librosa/index.html2、

Zero_to_zero1234

2215人浏览 · 2021-01-25 17:00:11

Zero_to_zero1234 · 2021-01-25 17:00:11 发布

1、librosa算是一个比较全面的音频处理库，可以用于音频读取、音频播放、时频转换、滤波、特征提取、计算歌曲节拍、相似度计算、绘制mel频谱等等，算是一个功能完备而使用方便的库。

使用说明：https://blog.csdn.net/zzc15806/article/details/79603994
官方文档：http://librosa.github.io/librosa/index.html

2、pyworld是一个高性能的声码器，用于将一段speech音频分离成基频(f0）、谐波谱包络和非周期谱包络，可以有效地将音频（比如人的歌声）的基频提出或者计算调式。

文档：https://github.com/JeremyCCHsu/Python-Wrapper-for-World-Vocoder
参考博客：

https://zhuanlan.zhihu.com/p/76704615
https://www.sohu.com/a/219420730_723464

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

cover

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

cover

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

cover

「极限压缩量化未来」Modelers GeekDay上海站圆满落幕

所有评论(0)

查看更多评论

Zero_to_zero1234

@suiyueruge1314

已为社区贡献10条内容