NTT、LLMモデルに個人の発話を効率よく再現させる技術 (ASCII.jp)

NTTは同社版大規模言語(LLM)モデル「ツヅミ(tsuzumi)」の拡張技術として、少量の対話データから個人の口調や発話内容の特徴を反映して対話を生成する「個人性再現対話技術」、および少量の音声データから個人の声色を反映した音声を合成する「ゼロ/フューショット(Zero/Few-shot)音声合成技術」を開発した。これまでは個人の特徴を学習し再現するには個人に関するデータが大量に必要だったが、少 …

Newskey

NTT、LLMモデルに個人の発話を効率よく再現させる技術 (ASCII.jp)

Archives