もっと詳しく

音声も画像もまぜこぜで、人間みたいなスピード感で会話。 OpenAIが新たなフラッグシップモデル「GPT-4o(フォー・オー)」を発表しました。GPT-4に比べて画像や音声の理解力が大幅に向上していて、テキストでも音声でも画像でもひとつの会話の中で自然に受け止めてくれます。 人間の呼吸音も表情も、意味を理解 デモでは音声での会話を軸に、GPT-4oの多彩な能力を見せてくれました。たとえば「緊張して …