ChatTTS に基づいた UI ソフトウェアは、大規模言語モデルアシスタントの対話タスク、対話音声生成、ビデオ紹介、教育およびトレーニングコンテンツの音声合成などに使用できます。ChatTTS は、豊富で多様なデータセットのトレーニングにより、合成音声の自然さを確保しています。
ソフトウェアの特徴
- 自動ビデオ翻訳:faster-whisper モデルの統合 / およびカスタム huggingface モデルのサポート。同時に、バッチ音声を字幕に変換、バッチ字幕翻訳、バッチ音声合成ツールを統合しています。
- 複数の音声合成および翻訳チャネル:音声合成:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS。翻訳:Google|ChatGPT|DeepL|Gemini|Mircosoft | 百度 | 腾讯 | 本地模型
- 完全オフライン対応:翻訳チャネルをローカルモデルに置き換え、音声合成チャネルを clone-voice に置き換えることで、完全にオフラインでビデオ翻訳を実現できます。
- 無料 + オープンソース:コードは GitHub で公開され、無料で機能制限なし、隠れた料金はありません。オープンソースライセンスは GPL-v3 です。
プロジェクトリンク