もし興味があれば、こちらにリンクがあります:https://audiobox.metademolab.com/(魔法は必要ありません)
Audiobox Maker を通じて、初心者のユーザーでもさまざまなキャラクター(赤ずきん、オオカミ、おばあさんなど)の音声ファイルを設計・生成し、さまざまな効果音を追加することができます。ファイルをドラッグアンドドロップし、組み合わせることで、レゴのようにストーリーを作り上げることができます。
実際には、Audiobox は 6 つの AI ツールを集めた「モデルシリーズ」と見なすことができます。それには、音声のクローン、テキストから音声への変換、テキストから効果音への変換(拍手、犬の鳴き声、車のクラクション、雷の音など)、指定した場所に効果音を追加または指定した部分を削除する機能が含まれています。
結果は以下の通りです:
Meta は、最先端の製品と比較して、Audiobox は FAD(Frechet Audio Distance)を 50%低下させ、品質と忠実度の面で実際のオーディオに匹敵すると主張しています。