もっと詳しく

米OpenAIは、音声、視覚、テキストをリアルタイムで推論できる、AIモデルの最新フラッグシップとなる「GPT-4o」を5月13日(現地時間)に発表した。 GPT-4oのoはオムニを意味し、テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像のあらゆる組み合わせの出力を生成する。音声入力には232msでの応答が可能で、平均では320msと会話における人間の応答時間とほ …