OpenAI、GPT-4のエラーを指摘するGPT-4ベースの「CriticGPT」リリース (ITmedia)

米OpenAIは6月27日(現地時間)、ChatGPTなどのLLMの出力の誤りを検出するためのGPT-4ベースのモデル「CriticGPT」を発表した。人間によるAIトレーニングの際に、ChatGPTの回答の誤りを指摘することで、トレーニングの精度向上を支援する。 ChatGPTは、RLHF(人間からのフィードバックによる強化学習)と呼ばれる手法を用いて、人間との対話に適したモデルへと調整されて …

Newskey

OpenAI、GPT-4のエラーを指摘するGPT-4ベースの「CriticGPT」リリース (ITmedia)

Archives