15.1K 星！Fish Speech 1.5 正式上線！全球領先的多語言 TTS 工具！可本地部署“調教”。

2024年12月6日#AI530

AI 翻譯

這篇文章透過AI由簡體中文翻譯成繁體中文。查看原文

AI 生成的摘要

FishSpeech 是由 FishAudio 團隊開發的 TTS 語音生成工具，與 ChatTTS 同期開源，專注於 AI 聲音克隆。其主要功能包括： - **零樣本 & 小樣本 TTS**：僅需 10-30 秒的聲音樣本即可生成高品質語音。 - **無音素依賴的強泛化能力**：能處理任何文字表示的語言，應用場景廣泛。 - **超高準確率**：在 5 分鐘的英文文本上，字符錯誤率和詞錯誤率約 2%。 - **多界面支持**：提供基於 Gradio 的 WebUI 和 PyQt6 GUI，方便用戶使用。 - **輕鬆部署**：支持本地和雲端快速部署，減少速度損失。更多信息可訪問官方網站和 GitHub 頁面。

項目介紹 FishSpeech 是由 FishAudio 團隊開發的一款 TTS 語音生成工具，與 ChatTTS 屬於同時期（2024 年 6-7 月）開源的超熱門的 TTS 項目。而說起其團隊成員，更是 GitHub 上的各類 SVC 大佬，也就是專做 AI 聲音克隆的教父們。

主要功能

・零樣本 & 小樣本 TTS：只需 10-30 秒的聲音樣本，即可生成高質量語音，完美支持聲音克隆需求。
・無音素依賴的強泛化能力：Fish Speech 的模型對音素無依賴，可以輕鬆處理任何文字表示的語言，讓 TTS 應用場景更加廣泛。
・超高準確率：在 5 分鐘的英文文本上，字符錯誤率（CER）和詞錯誤率（WER）僅約 2%。
・用戶友好的多界面支持：
・WebUI：基於 Gradio 的網頁用戶界面，兼容主流瀏覽器（Chrome、Firefox、Edge）。
・GUI 推理：提供 PyQt6 圖形界面，與 API 伺服器無縫協作。
・輕鬆部署：無論是本地還是雲端，都支持快速部署，最大限度減少速度損失，為開發者提供極大的便利性。

官網首頁：https://fish.audio

GitHub 項目地址： https://github.com/fishaudio/fish-speech

HF Demo：https://huggingface.co/spaces/fishaudio/fish-speech-1