オープンソースを支援する

TTS ONNX Sherpa ONNX を利用した音声合成プログラム

GitHub

Why

リナックス上で高品質な韓国語・中国語・日本語のオフライン TTS の選択肢が、まだ十分ではないためです。

ローカル | 高速 | 韓国語 | 中国語 | 日本語 | 英語

概要

TTS ONNX は Sherpa-ONNX を基盤としたリナックス優先のテキスト読み上げランタイムです。 オフライン音声合成、多言語ボイス運用、CLI 利用、HTTP サービスモードをサポートします。

Sherpa-ONNX は k2-fsa プロジェクトのオープンソース音声ツールキットです。 ONNX Runtime を使ってローカル推論を行い、音声合成や音声認識などの機能を構成する部品を提供します。

オフライン重視

クラウド推論なしでローカルに音声を生成します。

モデル管理

KO/ZH/JA/EN モデルの導入・一覧・管理を行えます。

2つの実行モード

1つのバイナリで CLI とサービス API の両方を利用できます。

Sherpa-ONNX プロジェクト URL

モデル URL(推奨)

CLI の使い方

モデルのインストール

./bin/tts --install-remote-id vits-mimic3-ko_KO-kss_low
./bin/tts --lang zh --install-remote-id vits-piper-zh_CN-huayan-medium
./bin/tts --lang ja --install-remote-id kokoro-int8-multi-lang-v1_0
./bin/tts --install-remote-id kitten-nano-en-v0_1-fp16

利用可能なボイス一覧

./bin/tts --voice-list
./bin/tts --voice-list --lang ko
./bin/tts --voice-list --lang zh
./bin/tts --voice-list --lang ja
./bin/tts --voice-list --lang en

音声合成

./bin/tts --lang ko "안녕하세요. 오프라인 테스트입니다."
./bin/tts --lang zh "这是中文语音合成测试。"
./bin/tts --lang ja "こんにちは。オフラインテストです。"
./bin/tts --lang en "Hello, this is an offline test."

WAV ファイルに保存

./bin/tts --out ./out.wav "save this audio"

サービスとして使う

サービスを直接起動

./bin/tts --service --config ./config/config.sherpa.yaml

ユーザーサービスを導入 (systemd --user)

bash ./scripts/install-user-unit.sh
bash ./scripts/enable-user-service.sh

ヘルスチェック

curl -fsS http://127.0.0.1:18741/v1/health

API で読み上げ

curl -X POST http://127.0.0.1:18741/v1/speak \
  -H 'content-type: application/json' \
  -d '{"text":"hello world","lang":"en","format":"wav"}' \
  --output out.wav

API でインストール済みモデル確認

curl -fsS http://127.0.0.1:18741/v1/models
サービスベース URL: http://127.0.0.1:18741/v1
主なエンドポイント: /health, /models, /models/install, /speak, /stop, /metrics.

ライセンス

本プロジェクトは GNU General Public License v3.0 (GPL-3.0) の下で公開されています。詳細は LICENSE.txt を参照してください。

ダウンロード

リリースをダウンロード

runable dad image