Googleの研究者がデジタルアバター合成のためのマルチモーダル拡散モデル「VLOGGER」の研究成果を公表した。人物を写した画像1枚と音声データから、自然な表情とふるまいで話すリアルなデジタルアバターを生成できる。 入力した画像 生成されたビデオ 特定の人物の顔の生成や顔の動きの再現では、個人のデータセットに基づいてモデルを再トレーニングしたり、微調整するのが一般的である。しかし、研究論文「VL …
Googleの研究者がデジタルアバター合成のためのマルチモーダル拡散モデル「VLOGGER」の研究成果を公表した。人物を写した画像1枚と音声データから、自然な表情とふるまいで話すリアルなデジタルアバターを生成できる。 入力した画像 生成されたビデオ 特定の人物の顔の生成や顔の動きの再現では、個人のデータセットに基づいてモデルを再トレーニングしたり、微調整するのが一般的である。しかし、研究論文「VL …