AIバーチャルキャラクターに新しい遊び方が登場！初の身体動作を持つAI口型同期プロジェクト：EchoMimic V2。

2024年12月10日#AI477

AI 翻訳

この記事はAIを通じて中国語から日本語に翻訳されました。原文を表示

AI が生成した要約

これは音声駆動の半身人物アニメーション生成モデルで、リアルなアニメーション効果を実現します。V1ではデジタル顔プロジェクトが行われ、V2では魅力的な半身人物動画が生成可能になりました。音声姿勢動的調整戦略を用いて、半身の詳細や表情、ジェスチャーを強化し、条件の冗長性を減少させます。デジタル人ライブ配信やバーチャルアナウンサー、動画編集、AIナレーションなどに利用できます。 - GitHub リポジトリ: [echomimic_v2](https://github.com/antgroup/echomimic_v2) - オンラインデモ: [Hugging Face](https://huggingface.co/spaces/fffiloni/echomimic-v2)

オープンソースの人体アニメーション生成モデルで、音声を通じて半身人物のリアルなアニメーション効果を生成することをサポートします。魅力的な動作表現、簡素化された生成プロセス、半身人物アニメーションの特徴を持ち、音声駆動の人物の会話、表情、肢体動作の調和を実現します。

V1 モデルはデジタルフェイスプロジェクトを行い、V2 では魅力的な半身人物動画の生成をサポートします。これは新しい音声ポーズ動的調整戦略を利用しており、ポーズサンプリングと音声拡散を含むことで、半身の詳細、顔、ジェスチャーの表現力を強化し、条件の冗長性を減少させます。デジタル人のライブ配信、バーチャルアナウンサー、動画編集、AI ナレーションなどのプロジェクトに使用できます。

GitHub リポジトリ：https://github.com/antgroup/echomimic_v2

オンラインデモ：https://huggingface.co/spaces/fffiloni/echomimic-v2