使用豆包大模型语音合成API生成语音文件
豆包语音合成API使用指南:注册火山引擎账号后获取APPID和AccessToken,下载Demo工程并配置参数(包括音色类型、文本内容等),通过VS2026编译运行即可生成.wav音频文件。注意部分缩写(如"2B")的读音可能不符合预期。GitHub提供简化参数的Demo工程供参考。
豆包的音色比较好听,试了一下使用C#输入文本,调用远程API,生成音频文件,还是比较简单。
1、首先,开通豆包的火山引擎
输入账号登录-火山引擎,按提示进行注册即可。
2、获取API服务接口认证信息
主要是APP ID和Access Token,按下图方法查看。这里需要稍微注意一下,不要到“API Key 管理”中去找。


3、下载Demo验证

4、获取音色参数
demo使用"豆包语音合成模型1.0" 音色列表,路径如下:

5、工程编译
解压Demo后有两个文件,使用Vs2026打开两个工程文件,设置“Volcengine.Speech.Binary”为运行工程,引用项目“Speech.Protocols”。


输入的调试参数:--appid <appid> --access_token <access_token> --voice_type <voice_type> --text "**你好**,这是一个测试文本。我们正在测试文本转语音功能。"
<appid>、<access_token>、<voice_type>替换为上面步骤获取的值。
运行成功后,会在运行目录下生成.wav文件。
工程下载地址(去掉了命令行参数,改为固定参数):GitHub - PascalMing/Volcengine.Speech.Binary: 豆包大模型语音合成API生成语音文件Demo
6、其他
部分缩写不如人意,比如“2B市场”读为2B,而不是ToB。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)