もっと詳しく

従来のテキストベースの文書読解と、視覚読解技術の比較。視覚読解技術(右)では図中のレイアウト(位置関係)を含めて情報を理解し、質問に回答している 日本電信電話株式会社(NTT)は4月12日、大規模言語モデル(LLM)により、図表やグラフ、文字修飾やレイアウトといった情報を含む文書を読解する、視覚読解技術を実現したと発表した。同社製のLLM「tsuzumi」のアダプタ技術として採用・導入されている。 …