もっと詳しく

Google DeepMindは6月17日、動画のピクセルデータから音声を自動生成する技術「Video-to-Audio(V2A)」を発表した。この技術により無音の生成AI動画に自然な音声、音楽、効果音、セリフを追加することが可能になる。 動画の内容を直接解析して音声を生成 V2Aは動画の内容(ピクセルデータ)を直接解析し、動きやタイミングに合わせて適切な音声をリアルタイムで自然に同期させることが …