もっと詳しく

サイバーエージェントは6月13日、日本語大規模言語モデル(LLM)に画像認識機能を追加した大規模視覚言語モデル(VLM)「llava-calm2-siglip」を公開した。 日本語に特化した75億パラメーターのVLM 2024年6月現在、テキストと画像の同時処理に対応したAIモデル(VLM)は複数の企業から発表されているが、多くは英語圏で作られたもので、日本語に特化したモデルは少ない。こうした状況 …