OpenAI、ChatGPTの間違いを見つけるAI「CriticGPT」 (PC Watch)

OpenAIは27日、ChatGPTの間違いを見つけるためのAIモデル「CriticGPT」を発表した。ChatGPTと同様にGPT-4をベースに構築されている。 ChatGPTのベースとなるGPT-4シリーズのAIモデルは、RLHF(Reinforcement Learning from Human Feedback、人間のフィードバックによる強化学習)と呼ばれる手法で構築されており、モデルが出 …

Newskey

OpenAI、ChatGPTの間違いを見つけるAI「CriticGPT」 (PC Watch)

Archives