Meta的最新语音生成器Audiobox Maker

2023年12月21日#AI165

AI 生成的摘要

Audiobox是一个汇聚了六个AI工具的模型系列，可以帮助用户设计和生成不同人物的声音文件，并添加声效。与之前的产品相比，Audiobox在质量和保真度方面有很大的提升。

透过 Audiobox Maker ，即使是小白用户也可以设计、生成不同人物（比如小红帽、大灰狼和外婆）的声音文件，同时添加不同声效，通过拖曳、排列组合各种文件（就像搭乐高），自编自导一出故事。

事实上，你可以将 Audiobox 看作一个汇聚了六个 AI 工具的「模型系列」，包括克隆声音、文本到声音、文本到音效（比如掌声、狗叫、汽车喇叭、雷声）、在指定地方添加音效或删除指定部分等。

结果如下：

Meta 声称，与之前最先进的产品相比，Audiobox 将 FAD （Frechet Audio Distance 的缩写，FAD 值越小越好）降低了 50% ，在质量和保真度方面堪与真实音频相媲美。