もっと詳しく

日本電信電話(NTT)は4月12日、LLM(Large Language Models:大規模言語モデル)によって視覚情報も含めて文書を理解する「視覚読解技術」を実現したことを発表した。実験においては、文書画像を提示しながらさまざまな質問への回答が可能なAIの実現可能性も示唆されているという。この成果はNTT版LLMである「tsuzumi」のアダプタ技術として採用される。 従来のLLMの課題 従来 …