もっと詳しく

人工知能(AI) LLMs become more covertly racist with human intervention LLMに「隠れ人種差別」、アライメントによる是正に限界 大規模言語モデル(LLM)には人種的なバイアスが含まれている。テック企業はバイアスを是正するために手作業でフィードバック訓練を実施しているが、効果は限定的であり、モデルが大規模になるにつれてバイアスは悪化すること …