Windows 使用 pocketsphinx 做中文语音识别
下载安装 pocketsphinx在 Windows 上,可以通过下面地址直接下载编译好的二进制可执行包。https://cmusphinx.github.io/wiki/download/注:下载其中 pocketsphinx 的 5prealpha 版本。下载后,解压之。下载模型文件模型文件下载地址https://sourceforge.net/projects/cmusp...
·
下载安装 pocketsphinx
在 Windows 上,可以通过下面地址直接下载编译好的二进制可执行包。
注:下载其中 pocketsphinx 的 5prealpha 版本。
下载后,解压之。
下载模型文件
模型文件下载地址
https://sourceforge.net/projects/cmusphinx/files/Acoustic and Language Models/
其中 Mandarin 为中文普通话,下载下来之后我们可以看到
- 声学模型:zh_broadcastnews_16k_ptm256_8000.tar.bz2 (需要解压)
- 语言模型:zh_broadcastnews_64000_utf8.DMP
- 拼音字典:zh_broadcastnews_utf8.dic
测试中文语音识别
- 首先准备一个中文音频文件(要求:.wav 格式,采样频率 16000HZ,单声道)
- 将下载的中文模型文件和解压后的 pocketsphinx 目录放到同一个目录下,这里假定就叫“中文语音识别”。
- 进入“中文语音识别”目录,然后运行下面的命令
pocketsphinx\bin\Release\x64\pocketsphinx_continuous.exe -hmm zh_broadcastnews_ptm256_8000 -lm zh_broadcastnews_64000_utf8.DMP -dict zh_broadcastnews_utf8.dic -infile myfile-16000.wav > myfile.txt - 运行完毕后,查看 myfile.txt 文件,内容即是程序识别出来的中文。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)