Meta的最新語音生成器Audiobox Maker

2023年12月21日#AI166

AI 翻譯

這篇文章透過AI由簡體中文翻譯成繁體中文。查看原文

AI 生成的摘要

Audiobox Maker是一个汇聚了六个AI工具的模型系列，可以帮助用户设计和生成不同人物的声音文件，并添加不同的声效。通过拖曳和排列组合文件，用户可以自编自导一个故事。Meta声称，Audiobox在质量和保真度方面与真实音频相媲美，将FAD值降低了50%。

透過 Audiobox Maker ，即使是小白用戶也可以設計、生成不同人物（比如小紅帽、大灰狼和外婆）的聲音檔案，同時添加不同聲效，通過拖曳、排列組合各種檔案（就像搭樂高），自編自導一出故事。

事實上，你可以將 Audiobox 看作一個匯聚了六個 AI 工具的「模型系列」，包括克隆聲音、文本到聲音、文本到音效（比如掌聲、狗叫、汽車喇叭、雷聲）、在指定地方添加音效或刪除指定部分等。

結果如下：

Meta 声稱，與之前最先進的產品相比，Audiobox 將 FAD （Frechet Audio Distance 的縮寫，FAD 值越小越好）降低了 50% ，在質量和保真度方面堪與真實音頻相媲美。