项目介绍 FishSpeech 是由 FishAudio 团队开发的一款 TTS 语音生成工具,与 ChatTTS 属于同时期(2024 年 6-7 月)开源的超热门的 TTS 项目。而说起其团队成员,更是 GitHub 上的各类 SVC 大佬,也就是专做 AI 声音克隆的教父们。
主要功能
・ 零样本 & 小样本 TTS:只需 10-30 秒的声音样本,即可生成高质量语音,完美支持语音克隆需求。
・ 无音素依赖的强泛化能力:Fish Speech 的模型对音素无依赖,可以轻松处理任何文字表示的语言,让 TTS 应用场景更加广泛。
・ 超高准确率:在 5 分钟的英文文本上,字符错误率(CER)和词错误率(WER)仅约 2%。
・ 用户友好的多界面支持:
・ WebUI:基于 Gradio 的网页用户界面,兼容主流浏览器(Chrome、Firefox、Edge)。
・ GUI 推理:提供 PyQt6 图形界面,与 API 服务器无缝协作。
・ 轻松部署:无论是本地还是云端,都支持快速部署,最大限度减少速度损失,为开发者提供极大的便利性。
官网主页:https://fish.audio
GitHub 项目地址: https://github.com/fishaudio/fish-speech
HF Demo:https://huggingface.co/spaces/fishaudio/fish-speech-1