項目介紹 FishSpeech 是由 FishAudio 團隊開發的一款 TTS 語音生成工具,與 ChatTTS 屬於同時期(2024 年 6-7 月)開源的超熱門的 TTS 項目。而說起其團隊成員,更是 GitHub 上的各類 SVC 大佬,也就是專做 AI 聲音克隆的教父們。
主要功能
・零樣本 & 小樣本 TTS:只需 10-30 秒的聲音樣本,即可生成高質量語音,完美支持聲音克隆需求。
・無音素依賴的強泛化能力:Fish Speech 的模型對音素無依賴,可以輕鬆處理任何文字表示的語言,讓 TTS 應用場景更加廣泛。
・超高準確率:在 5 分鐘的英文文本上,字符錯誤率(CER)和詞錯誤率(WER)僅約 2%。
・用戶友好的多界面支持:
・WebUI:基於 Gradio 的網頁用戶界面,兼容主流瀏覽器(Chrome、Firefox、Edge)。
・GUI 推理:提供 PyQt6 圖形界面,與 API 伺服器無縫協作。
・輕鬆部署:無論是本地還是雲端,都支持快速部署,最大限度減少速度損失,為開發者提供極大的便利性。
官網首頁:https://fish.audio
GitHub 項目地址: https://github.com/fishaudio/fish-speech
HF Demo:https://huggingface.co/spaces/fishaudio/fish-speech-1