AI歌手训练预处理--音频文件人声分离
模型的训练需要大量的音频。鉴于国语与粤语的区别,因此我只选择了其中44首国语歌曲,尝试训练一下国语版的eason。这里需要用到一个github上开源的工具--slpeeter。通过这个工具,可以直接去分离人声与背景音乐,非常方便。另外,分离背景音乐与人声需要用到该工具下的双声道模型。将压缩包解压后将其中的模型复制到SpleeterGUI文件夹中的pretrained_models文件夹中(见上图)
模型的训练需要大量的音频。所以我首先搜集了eason百多首wav的歌曲。鉴于国语与粤语的区别,因此我只选择了其中44首国语歌曲,尝试训练一下国语版的eason。(其实我更喜欢easonde粤语歌。)
下载好歌曲之后,需要去除背景音乐,得到纯净的人声。尝试自己构建模型过于复杂,音频剪辑的软件不方便批量操作。
这里需要用到一个github上开源的工具--slpeeter。通过这个工具,可以直接去分离人声与背景音乐,非常方便。效果也不错,分离速度也很快。下载不易,我将文件打包整理在百度网盘中,分享在文末。

这个工具有gui版的,下载之后直接打开。双击该gui应用程序即可。

另外,分离背景音乐与人声需要用到该工具下的双声道模型。即下图中的2stems。将压缩包解压后将其中的模型复制到SpleeterGUI文件夹中的pretrained_models文件夹中(见上图)。


gui界面的使用:
parts to separate选择2,表示分离出两个声道。即背景音乐与人声。
save to:选择自己想要保存的路径即可。
带宽与音频时长默认即可。
将需要处理的音频文件直接拖到这个工具界面即可。

处理完之后会得到一个文件夹,文件夹包含两个音频文件。一个音频文件表示伴奏,一个表示人声(vocals)。

分离的效果还不错。
SpleeterGUI工具分享:
链接:https://pan.baidu.com/s/1dR7wIRV9oQPrHuJxIv78-w?pwd=r1dr
提取码:r1dr
--来自百度网盘超级会员V5的分享
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)