もっと詳しく

OpenAIは27日、ChatGPTの間違いを見つけるためのAIモデル「CriticGPT」を発表した。ChatGPTと同様にGPT-4をベースに構築されている。 ChatGPTのベースとなるGPT-4シリーズのAIモデルは、RLHF(Reinforcement Learning from Human Feedback、人間のフィードバックによる強化学習)と呼ばれる手法で構築されており、モデルが出 …