複数の画像について質疑応答できる日本語視覚言語モデル、Sakana AIが公開/「進化的モデルマージ」で構築、非英語圏における嚆矢に (窓の杜)

Posted byWpmaster
08/07/2024

Sakana AI、複数の画像を扱える日本語視覚言語モデルを公開 AIスタートアップのSakana AI(株)は8月2日、複数の画像について質疑応答できる日本語視覚言語モデル(VLM)「Llama-3-EvoVLM-JP-v2」および、複数の画像に関する日本語での質疑応答能力を評価するためのデータセット「Japanese multi-images visual question answering …

Newskey

複数の画像について質疑応答できる日本語視覚言語モデル、Sakana AIが公開/「進化的モデルマージ」で構築、非英語圏における嚆矢に (窓の杜)

Archives