15.1K Star！Fish Speech 1.5 正式上线！全球领先的多语言 TTS 工具！可本地部署“调教”。

2024年12月6日#AI530

AI 生成的摘要

FishSpeech 是由 FishAudio 团队开发的 TTS 语音生成工具，支持零样本和小样本 TTS，只需 10-30 秒的声音样本即可生成高质量语音。其模型对音素无依赖，能够处理多种语言，具有超高的准确率（CER 和 WER 约 2%）。提供用户友好的多界面支持，包括基于 Gradio 的 WebUI 和 PyQt6 图形界面，支持快速部署。更多信息可访问官网和 GitHub 项目地址。

项目介绍 FishSpeech 是由 FishAudio 团队开发的一款 TTS 语音生成工具，与 ChatTTS 属于同时期（2024 年 6-7 月）开源的超热门的 TTS 项目。而说起其团队成员，更是 GitHub 上的各类 SVC 大佬，也就是专做 AI 声音克隆的教父们。

主要功能

・零样本 & 小样本 TTS：只需 10-30 秒的声音样本，即可生成高质量语音，完美支持语音克隆需求。
・无音素依赖的强泛化能力：Fish Speech 的模型对音素无依赖，可以轻松处理任何文字表示的语言，让 TTS 应用场景更加广泛。
・超高准确率：在 5 分钟的英文文本上，字符错误率（CER）和词错误率（WER）仅约 2%。
・用户友好的多界面支持：
・ WebUI：基于 Gradio 的网页用户界面，兼容主流浏览器（Chrome、Firefox、Edge）。
・ GUI 推理：提供 PyQt6 图形界面，与 API 服务器无缝协作。
・轻松部署：无论是本地还是云端，都支持快速部署，最大限度减少速度损失，为开发者提供极大的便利性。

官网主页：https://fish.audio

GitHub 项目地址： https://github.com/fishaudio/fish-speech

HF Demo：https://huggingface.co/spaces/fishaudio/fish-speech-1