pyVideoTrans：ChatTTSを使用してテキストを音声合成するローカルWeb UI版535

ChatTTS に基づいた UI ソフトウェアは、大規模言語モデルアシスタントの対話タスク、対話音声生成、ビデオ紹介、教育およびトレーニングコンテンツの音声合成などに使用できます。ChatTTS は、豊富で多様なデータセットのトレーニングにより、合成音声の自然さを確保しています。

ソフトウェアの特徴

自動ビデオ翻訳：faster-whisper モデルの統合 / およびカスタム huggingface モデルのサポート。同時に、バッチ音声を字幕に変換、バッチ字幕翻訳、バッチ音声合成ツールを統合しています。
複数の音声合成および翻訳チャネル：音声合成：edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS。翻訳：Google|ChatGPT|DeepL|Gemini|Mircosoft | 百度 | 腾讯 | 本地模型
完全オフライン対応：翻訳チャネルをローカルモデルに置き換え、音声合成チャネルを clone-voice に置き換えることで、完全にオフラインでビデオ翻訳を実現できます。
無料 + オープンソース：コードは GitHub で公開され、無料で機能制限なし、隠れた料金はありません。オープンソースライセンスは GPL-v3 です。

プロジェクトリンク