支持开源项目

TTS ONNX 使用 Sherpa ONNX 的语音合成程序

GitHub

为什么

因为在 Linux 平台上,面向韩语、中文、日语的高质量离线 TTS 选择仍然不够多。

本地 | 快速 | 韩语 | 中文 | 日语 | 英语

它是什么

TTS ONNX 是一个基于 Sherpa-ONNX、以 Linux 平台为优先的文本转语音运行时。 支持离线语音合成、多语言语音流程、命令行使用和 HTTP 服务模式。

Sherpa-ONNX 是 k2-fsa 项目的开源语音工具包,使用 ONNX Runtime 进行本地推理, 提供文本转语音、语音识别等能力的基础组件,并支持多语言场景。

离线优先

无需云端推理,可直接在本机生成语音。

模型管理

支持 KO/ZH/JA/EN 模型安装、查看与维护。

双运行模式

同一个二进制可用于 CLI 和服务 API。

Sherpa-ONNX 项目链接

模型 URL(推荐)

CLI 使用方法

安装模型

./bin/tts --install-remote-id vits-mimic3-ko_KO-kss_low
./bin/tts --lang zh --install-remote-id vits-piper-zh_CN-huayan-medium
./bin/tts --lang ja --install-remote-id kokoro-int8-multi-lang-v1_0
./bin/tts --install-remote-id kitten-nano-en-v0_1-fp16

查看可用语音

./bin/tts --voice-list
./bin/tts --voice-list --lang ko
./bin/tts --voice-list --lang zh
./bin/tts --voice-list --lang ja
./bin/tts --voice-list --lang en

合成语音

./bin/tts --lang ko "안녕하세요. 오프라인 테스트입니다."
./bin/tts --lang zh "这是中文语音合成测试。"
./bin/tts --lang ja "こんにちは。オフラインテストです。"
./bin/tts --lang en "Hello, this is an offline test."

保存为 WAV 文件

./bin/tts --out ./out.wav "save this audio"

作为服务使用

直接启动服务

./bin/tts --service --config ./config/config.sherpa.yaml

安装用户服务 (systemd --user)

bash ./scripts/install-user-unit.sh
bash ./scripts/enable-user-service.sh

服务健康检查

curl -fsS http://127.0.0.1:18741/v1/health

通过 API 合成

curl -X POST http://127.0.0.1:18741/v1/speak \
  -H 'content-type: application/json' \
  -d '{"text":"hello world","lang":"en","format":"wav"}' \
  --output out.wav

通过 API 查看已安装模型

curl -fsS http://127.0.0.1:18741/v1/models
服务基础 URL: http://127.0.0.1:18741/v1
主要端点: /health, /models, /models/install, /speak, /stop, /metrics.

许可证

本项目采用 GNU General Public License v3.0 (GPL-3.0)。 许可证全文请见仓库中的 LICENSE.txt

下载

下载发布版本

runable dad image