AIの幻想に打ち勝つのは誰？Anthropic対Googleの最新対決情報！

GalileoがGenerative AIのための新しいHallucination Indexをリリース
主要22のGen AI LLMsを評価、OpenAI、Anthropic、Google、Metaを含む
今回の指数は11の新モデルを追加し大幅に拡大

Galileo、エンタープライズ向け生成型AI（Generative AI）を導く先駆企業が、最新のHallucination Index（幻覚指数）を発表し、注目を集めています。

この指数は、Retrieval Augmented Generation（RAG）に特化し、OpenAI、Anthropic、Google、Metaといった業界大手が開発した22の著名な生成AI（Gen AI）の言語モデル（LLMs）を評価するものです。
昨年に続き、今年の指数では評価対象モデルに11の新しいモデルを加え、評価の範囲を大幅に拡大しました。

人間の思考を模倣するAIの精度を測るこの指数は、技術の進歩と共にもたらされる潜在的な課題に光を当てています。
AIが生成する情報の信憑性は、その有用性に直結するため、このような指数は極めて重要な意味を持ちます。

発表された指数を通じて、我々は各社のAIがいかに現実に即した情報を生成しているか、または「幻覚」と称される誤情報をどの程度排除できているかを把握することが可能になります。
これにより、将来のAIの進化と、それがもたらす可能性について、理論と実装のギャップを埋めるための一助となることは間違いありません。

今後もGalileoは、効果的なAIの運用を支援し、その精度向上に寄与するための評価を継続していくでしょう。