もっと詳しく

Microsoft Research Asiaは2024年4月16日(米国時間)、1枚の顔の静止画像と音声クリップから、その顔の人物が本当に話しているかのような動画を生成できるAI(人工知能)モデル「VASA-1」を発表した。 VASA-1は、音声と唇の動きの正確な同期だけでなく、表情のニュアンスや自然な頭の動きなどさまざまな要素を通じて、全体としてリアルで生き生きとしながら話している顔の動画を生 …