如果你有兴趣,这里有传送门:https://audiobox.metademolab.com/(无需魔法)
透过 Audiobox Maker ,即使是小白用户也可以设计、生成不同人物(比如小红帽、大灰狼和外婆)的声音文件,同时添加不同声效,通过拖曳、排列组合各种文件(就像搭乐高),自编自导一出故事。
事实上,你可以将 Audiobox 看作一个汇聚了六个 AI 工具的「模型系列」,包括克隆声音、文本到声音、文本到音效(比如掌声、狗叫、汽车喇叭、雷声)、在指定地方添加音效或删除指定部分等。
结果如下:
Meta 声称,与之前最先进的产品相比,Audiobox 将 FAD (Frechet Audio Distance 的缩写,FAD 值越小越好)降低了 50% ,在质量和保真度方面堪与真实音频相媲美。