もっと詳しく

NTTは1月17日、少量の対話データから個人の口調や発話内容の特徴を反映して対話を生成する「個人性再現対話技術」と、少量の音声データから個人の声色を反映した音声を合成する「Zero/Few-shot音声合成技術」を開発したと発表した。 ともに大規模言語(Large Language Models:LLM)モデル「tsuzumi」の拡張技術で、本人のデジタルの分身を作成する際のコストを抑えることがで …