OpenAIが2026年3月5日にGPT-5.4をリリース。プロ向け作業のための高性能モデルとして、推論・コーディング能力が向上。発表直後からユーザーによる過剰な期待を含む活用事例が拡散しているが、公式発表内容とユーザー実証事例の間には注意深い検証が必要だ。
タグ: OpenAI
複数メディアの報道によると、OpenAIが双方向(BiDi)音声モデルを開発中。現在の音声モードは一方的な応答だが、新モデルはユーザーの割り込みにリアルタイムで応答し、より自然な会話を実現する可能性がある。OpenAIは現時点で公式には発表していない。
OpenAIがGPT-5.4をChatGPTとAPIで公開した。新モデルは推論、コーディング、エージェントワークフローを統合したフロンティアモデルとして位置付けられ、ChatGPTでは「Thinking」と「Pro」バージョンが提供される。
OpenAIが発表したGPT-5.4は、44職種の専門家と比較した内部評価で83%のケースで同等以上のパフォーマンスを記録。画面を見てマウスやキーボードを操作するコンピュータ使用機能を内蔵し、OSWorld-Verifiedベンチマークでは人間のベースラインを上回る75%を獲得した。
OpenAIが発表したGPT-5.4が、Vibe Code Benchで67.42%の総合精度を記録し首位を獲得した。このベンチマークは、短いテキスト仕様から完全に動作するアプリケーションを生成するモデルの能力を測定する。前回の最高スコアを5.65ポイント上回る結果となった。
OpenAIが発表したGPT-5.4が、極めて困難な数学問題を集めたベンチマーク「FrontierMath」で新記録を樹立した。Epoch AIによる事前評価では、Tiers 1-3で50%、最難関のTier 4で38%の正答率を記録。数学的推論能力の向上が示された。
Twitter上で、GPT 5.4がAIモデルベンチマーク「BridgeBench」で総合95.5点を記録し首位に立ったとする投稿が話題。ただし、公式情報での裏付けは現時点で確認できず、また応答速度(レイテンシー)が課題として指摘されている。
NVIDIAのジェンスン・フアンCEOは、OpenAIの資金調達ラウンドへの参加を明言した。投資額は「過去最大規模」になる可能性を示唆。同社は複数のAIモデル構築者とのパートナーシップを継続する方針。
GPT-5.4に関する複数の噂(2Mトークンコンテキスト、永続的状態保持)がSNSや海外メディアで報じられている。しかし、OpenAI公式リリースノートにはGPT-5.3までしか記載がなく、GPT-5.4の公式発表は確認されていない。Codexリポジトリでの一時的な言及はあったものの、すぐに修正されている。