5分钟极速搭建：edge-tts+Flask打造免费语音合成服务终极指南

还在为语音合成API密钥烦恼吗？想快速搭建一个免费的文本转语音服务吗？今天我要分享一个简单实用的方法，使用edge-tts和Flask，仅需5分钟就能搭建属于自己的语音合成服务！🎉## 什么是edge-tts？**edge-tts**是一个强大的Python模块，让你能够直接使用Microsoft Edge的在线文本转语音服务，完全不需要Microsoft Edge浏览器、Windows

姬珊慧Beneficient

372人浏览 · 2026-01-09 02:57:10

姬珊慧Beneficient · 2026-01-09 02:57:10 发布

5分钟极速搭建：edge-tts+Flask打造免费语音合成服务终极指南

【免费下载链接】edge-tts Use Microsoft Edge's online text-to-speech service from Python WITHOUT needing Microsoft Edge or Windows or an API key 项目地址: https://gitcode.com/GitHub_Trending/ed/edge-tts

还在为语音合成API密钥烦恼吗？想快速搭建一个免费的文本转语音服务吗？今天我要分享一个简单实用的方法，使用edge-tts和Flask，仅需5分钟就能搭建属于自己的语音合成服务！🎉

什么是edge-tts？

edge-tts是一个强大的Python模块，让你能够直接使用Microsoft Edge的在线文本转语音服务，完全不需要Microsoft Edge浏览器、Windows系统或任何API密钥！🚀

这个开源项目利用了微软Edge浏览器的语音合成能力，提供了高质量的语音输出，支持多种语言和声音选择。最棒的是，它是完全免费的！

为什么选择edge-tts？

✅ 完全免费 - 无需任何费用或API密钥 ✅ 高质量语音 - 基于微软Edge的语音合成技术 ✅ 多语言支持 - 支持全球多种语言和方言 ✅ 简单易用 - 几行代码就能实现功能 ✅ 跨平台 - 支持Windows、Linux、macOS

快速开始：搭建语音合成服务

第一步：环境准备

首先，你需要安装edge-tts：

pip install edge-tts

第二步：创建Flask应用

创建一个简单的Flask应用来提供语音合成API：

from flask import Flask, request, send_file
import edge_tts
import asyncio
import os

app = Flask(__name__)

async def generate_speech(text, voice="zh-CN-XiaoxiaoNeural"):
    communicate = edge_tts.Communicate(text, voice)
    filename = "output.mp3"
    await communicate.save(filename)
    return filename

@app.route('/tts', methods=['POST'])
def text_to_speech():
    text = request.json.get('text', '')
    voice = request.json.get('voice', 'zh-CN-XiaoxiaoNeural')
    
    loop = asyncio.new_event_loop()
    asyncio.set_event_loop(loop)
    filename = loop.run_until_complete(generate_speech(text, voice))
    
    return send_file(filename, as_attachment=True)

if __name__ == '__main__':
    app.run(debug=True)

第三步：测试服务

启动服务后，你可以使用以下命令测试：

curl -X POST http://localhost:5000/tts \
  -H "Content-Type: application/json" \
  -d '{"text": "你好，欢迎使用语音合成服务！"}' \
  --output speech.mp3

edge-tts核心功能详解

丰富的语音选择

edge-tts提供了全球多种语言的语音选择，包括：

中文普通话：zh-CN-XiaoxiaoNeural、zh-CN-YunxiNeural
英语：en-US-AriaNeural、en-US-GuyNeural
日语：ja-JP-NanamiNeural
韩语：ko-KR-SunHiNeural

查看所有可用语音：

edge-tts --list-voices

灵活的语音调节

你可以轻松调节语音的速度、音量和音调：

# 降低语速50%
edge-tts --rate=-50% --text "Hello World!"

# 降低音量50%  
edge-tts --volume=-50% --text "Hello World!"

# 降低音调50Hz
edge-tts --pitch=-50Hz --text "Hello World!"

高级用法：异步处理与流式传输

异步音频生成

对于需要处理大量请求的场景，可以使用异步版本：

import asyncio
import edge_tts

async def async_generate(text, voice="zh-CN-XiaoxiaoNeural"):
    communicate = edge_tts.Communicate(text, voice)
    await communicate.save("output.mp3")

实时语音流

edge-tts还支持实时语音流输出，非常适合实时应用：

communicate = edge_tts.Communicate(TEXT, VOICE)

async for chunk in communicate.stream():
    if chunk["type"] == "audio":
        # 处理音频数据
        audio_data = chunk["data"]

项目结构与源码解析

edge-tts项目结构清晰，主要包含以下核心模块：

核心通信模块：src/edge_tts/communicate.py - 处理与微软服务的通信
语音管理：src/edge_tts/voices.py - 管理可用语音列表
工具函数：src/edge_tts/util.py - 提供各种实用工具

实际应用场景

智能客服系统

为客服机器人添加自然流畅的语音回复功能

有声读物制作

快速将文本内容转换为高质量的有声读物

在线教育平台

为在线课程提供语音讲解，提升学习体验

智能家居控制

为智能家居设备添加语音提示功能

性能优化建议

连接池管理 - 使用aiohttp的连接池提高性能
异步处理 - 对于高并发场景使用异步版本
缓存机制 - 对常用短语的语音结果进行缓存

常见问题解答

Q: edge-tts需要网络连接吗？ A: 是的，它需要连接到微软的在线语音合成服务。

Q: 有使用限制吗？ A: 目前没有明确的限制，但建议合理使用。

Q: 支持哪些音频格式？ A: 主要支持MP3格式，质量很高。

总结

通过edge-tts和Flask的完美结合，你可以轻松搭建一个功能完整、性能优秀的语音合成服务。整个过程简单快捷，不需要复杂的配置或昂贵的API密钥。

现在就开始行动吧！克隆项目仓库，体验这个强大的语音合成工具：

git clone https://gitcode.com/GitHub_Trending/ed/edge-tts

无论你是开发者、产品经理还是技术爱好者，edge-tts都能为你的项目增添强大的语音功能。🌟

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

替你试过了，消费级显卡可以跑的开源文生图SOTA模型，顶级渲染、高密度文本绘图

魔乐社区

「极限压缩量化未来」Modelers GeekDay上海站圆满落幕

魔乐社区

所有评论(0)

查看更多评论

姬珊慧Beneficient

@gitblog_01031

已为社区贡献24条内容

5分钟极速搭建：edge-tts+Flask打造免费语音合成服务终极指南

姬珊慧Beneficient

5分钟极速搭建：edge-tts+Flask打造免费语音合成服务终极指南

什么是edge-tts？

为什么选择edge-tts？

快速开始：搭建语音合成服务

第一步：环境准备

第二步：创建Flask应用

第三步：测试服务

edge-tts核心功能详解

丰富的语音选择

灵活的语音调节

高级用法：异步处理与流式传输

异步音频生成

实时语音流

项目结构与源码解析

实际应用场景

智能客服系统

有声读物制作

在线教育平台

智能家居控制

性能优化建议

常见问题解答

总结

所有评论(0)

温馨提示：您尚未绑定手机号

姬珊慧Beneficient