TTS Server 文字转语音服务器使用指南
TTS Server 文字转语音服务器使用指南
【免费下载链接】tts-server tts-server-api 项目地址: https://gitcode.com/gh_mirrors/tt/tts-server
项目介绍
TTS Server 是一个基于 Rust 语言开发的文字转语音(Text-to-Speech)服务器应用。该项目集成了微软 Edge 浏览器的"大声朗读"API 和 Azure TTS 服务,提供高效的文本转语音能力。通过 WebSocket 连接保持技术,大幅提升了请求并发性和响应速度,特别适合需要大量语音转换的应用场景。
环境要求
在部署 TTS Server 之前,需要确保系统已安装 Rust 编程环境:
对于 Linux 系统,可通过以下命令安装 Rust:
curl --proto '=https' --tlsv1.3 -sSf https://sh.rustup.rs | sh
source $HOME/.cargo/env
安装完成后,验证 Rust 和 Cargo 版本:
rustc --version
cargo --version
项目下载与安装
首先克隆项目仓库到本地:
git clone https://gitcode.com/gh_mirrors/tt/tts-server
cd tts-server
然后编译项目:
cargo build --release
编译完成后,在 target/release 目录下会生成可执行文件 tts-server。
服务器启动与配置
基本启动方式
直接运行可执行文件,使用默认配置:
./target/release/tts-server
默认监听地址为 0.0.0.0,端口为 8080。
自定义配置启动
可以指定监听地址和端口:
./target/release/tts-server --listen-address 192.168.0.101 --listen-port 20222
查看帮助信息
./target/release/tts-server --help
API 接口说明
TTS Server 提供以下三种主要的文本转语音接口:
- Edge 渠道接口:
/api/tts-ms-edge - 官网预览渠道接口:
/api/tts-ms-official-preview - 官方订阅 Key 渠道接口:
/api/tts-ms-subscribe-api
接口支持 GET 和 POST 请求方式。GET 请求时参数拼接在 URL 上,POST 请求时使用 JSON body 传递参数。
请求参数
text:待转换的文本内容(必填)informant:发音人(可选,默认:zh-CN-XiaoxiaoNeural)style:发音风格(可选,默认:general)rate:语速(可选,范围:0-3,默认:1)pitch:音调(可选,范围:0-2,默认:1)quality:音频格式(可选,默认:audio-24khz-48kbitrate-mono-mp3)
发音人和音频格式
查看支持的发音人列表
./target/release/tts-server --show-informant-list
主要支持的发音人包括:
- Xiaoxiao(Neural)-晓晓
- Yunyang(Neural)-云扬
- Xiaochen(Neural)-晓辰
- Xiaohan(Neural)-晓涵
- Xiaomo(Neural)-晓墨
- Xiaoqiu(Neural)-晓秋
查看支持的音频格式
./target/release/tts-server --show-quality-list
支持的音频格式包括 MP3、OPUS、PCM 等多种格式,如:
- audio-16khz-128kbitrate-mono-mp3
- audio-24khz-160kbitrate-mono-mp3
- audio-48khz-192kbitrate-mono-mp3
- ogg-24khz-16bit-mono-opus
发音风格
支持的发音风格丰富,包括:
- affectionate:温暖亲切的语气
- angry:生气厌恶的语气
- assistant:数字助理的语气
- calm:沉着冷静的态度
- cheerful:积极愉快的语气
- fearful:恐惧紧张的语气
使用示例
在阅读软件中的配置示例
http://192.168.0.101:20222/api/tts-ms-edge,{
"method": "POST",
"body": {
"informant": "zh-CN-XiaoxiaoNeural",
"style": "general",
"rate": {{ speakSpeed / 6.5 }},
"quality": "audio-48khz-96kbitrate-mono-mp3",
"text": "{{java.encodeURI(speakText).replace('+','%20')}}"
}
}
后台运行(Linux)
使用 screen 工具让服务器在后台运行:
screen -S tts-server ./target/release/tts-server --listen-port 20222
注意事项
- 项目目前主要使用 Edge 浏览器和 Azure TTS 演示页面的接口,除官方订阅接口外,不保证后续的可用性和稳定性
- 强烈推荐使用官方订阅接口以获得更好的服务稳定性
- 本项目构建的二进制程序仅供学习交流和参考,严禁用于商业用途
- 微软官方的 Azure TTS 服务目前拥有一定的免费额度,如果免费额度足够使用,请支持官方服务
项目维护
如果有人愿意贡献代码或改进项目,请直接提交 Pull Request。项目作者鼓励社区参与和贡献,共同完善这个文字转语音服务器解决方案。
【免费下载链接】tts-server tts-server-api 项目地址: https://gitcode.com/gh_mirrors/tt/tts-server







