如果你有興趣,這裡有傳送門:https://audiobox.metademolab.com/(無需魔法)
透過 Audiobox Maker ,即使是小白用戶也可以設計、生成不同人物(比如小紅帽、大灰狼和外婆)的聲音檔案,同時添加不同聲效,通過拖曳、排列組合各種檔案(就像搭樂高),自編自導一出故事。
事實上,你可以將 Audiobox 看作一個匯聚了六個 AI 工具的「模型系列」,包括克隆聲音、文本到聲音、文本到音效(比如掌聲、狗叫、汽車喇叭、雷聲)、在指定地方添加音效或刪除指定部分等。
結果如下:
Meta 声稱,與之前最先進的產品相比,Audiobox 將 FAD (Frechet Audio Distance 的縮寫,FAD 值越小越好)降低了 50% ,在質量和保真度方面堪與真實音頻相媲美。