TTS ONNX 使用 Sherpa ONNX 的语音合成程序
GitHub为什么
因为在 Linux 平台上,面向韩语、中文、日语的高质量离线 TTS 选择仍然不够多。
本地 | 快速 | 韩语 | 中文 | 日语 | 英语它是什么
TTS ONNX 是一个基于 Sherpa-ONNX、以 Linux 平台为优先的文本转语音运行时。 支持离线语音合成、多语言语音流程、命令行使用和 HTTP 服务模式。
Sherpa-ONNX 是 k2-fsa 项目的开源语音工具包,使用 ONNX Runtime 进行本地推理, 提供文本转语音、语音识别等能力的基础组件,并支持多语言场景。
离线优先
无需云端推理,可直接在本机生成语音。
模型管理
支持 KO/ZH/JA/EN 模型安装、查看与维护。
双运行模式
同一个二进制可用于 CLI 和服务 API。
Sherpa-ONNX 项目链接
模型 URL(推荐)
- 韩语 (Mimic3 VITS): vits-mimic3-ko_KO-kss_low.tar.bz2
- 中文 (Piper): vits-piper-zh_CN-huayan-medium.tar.bz2
- 日语/多语种 (Kokoro Int8): kokoro-int8-multi-lang-v1_0.tar.bz2
- 英语 (Kitten): kitten-nano-en-v0_1-fp16.tar.bz2
CLI 使用方法
安装模型
./bin/tts --install-remote-id vits-mimic3-ko_KO-kss_low
./bin/tts --lang zh --install-remote-id vits-piper-zh_CN-huayan-medium
./bin/tts --lang ja --install-remote-id kokoro-int8-multi-lang-v1_0
./bin/tts --install-remote-id kitten-nano-en-v0_1-fp16
查看可用语音
./bin/tts --voice-list
./bin/tts --voice-list --lang ko
./bin/tts --voice-list --lang zh
./bin/tts --voice-list --lang ja
./bin/tts --voice-list --lang en
合成语音
./bin/tts --lang ko "안녕하세요. 오프라인 테스트입니다."
./bin/tts --lang zh "这是中文语音合成测试。"
./bin/tts --lang ja "こんにちは。オフラインテストです。"
./bin/tts --lang en "Hello, this is an offline test."
保存为 WAV 文件
./bin/tts --out ./out.wav "save this audio"
作为服务使用
直接启动服务
./bin/tts --service --config ./config/config.sherpa.yaml
安装用户服务 (systemd --user)
bash ./scripts/install-user-unit.sh
bash ./scripts/enable-user-service.sh
服务健康检查
curl -fsS http://127.0.0.1:18741/v1/health
通过 API 合成
curl -X POST http://127.0.0.1:18741/v1/speak \
-H 'content-type: application/json' \
-d '{"text":"hello world","lang":"en","format":"wav"}' \
--output out.wav
通过 API 查看已安装模型
curl -fsS http://127.0.0.1:18741/v1/models
服务基础 URL:
主要端点:
http://127.0.0.1:18741/v1主要端点:
/health, /models, /models/install, /speak, /stop, /metrics.
许可证
本项目采用
GNU General Public License v3.0 (GPL-3.0)。
许可证全文请见仓库中的
LICENSE.txt。
下载
下载发布版本