OpenAI開発者向けアカウントがGPT-5.3-CodexのAPI一般提供開始をツイートしたが、公式情報ではAPIアクセスは「近日中に安全に有効化予定」とされており、現時点での全開発者向け即時利用は確認できない。情報の齟齬と実際の提供状況を整理する。
カテゴリー: AIモデル・研究
2026年2月リリースのMiniMax M2.5が、コーディングベンチマークでClaude Opus 4.6と同等の性能を達成。特にエージェントタスクで優位性を示す一方、価格はOpusの1/20〜1/60と大幅に安価。一般推論ではOpusが依然優位。
Twitterで話題となった動画では、Gemini 3.1 ProがCRDTに関する詳細な研究論文を読み込み、機能するローカルファースト型シミュレーションアプリを構築した。これは、同モデルが公式に謳う「複雑なシステムの統合」能力をユーザーが検証した一例であり、理論からデバッグ済みの対話型アプリへの橋渡しを長期的なタスクで実現したことを示している。
NVIDIAがロボット向け世界モデル「DreamDojo」を発表。44,000時間の一人称視点動画で学習し、物理世界の行動結果を予測・シミュレーションする。蒸留後は約10FPSで1分以上の未来予測が可能。
GoogleがGemini 3.1 Proを正式リリースした。複雑なコーディング、多モード理解、エージェント機能に優れた最先端の推論モデル。一方、Twitterで話題のOpus 4.6との比較や、特定の3Dアプリ構築プロンプトに関する公式情報は現時点で確認されていない。
GoogleがGemini 3.1 Proを発表し、推論性能が前モデル比2倍に向上。Claude Opus 4.6とのベンチマーク比較では、GeminiがARC-AGI-2やGPQA Diamondで優位、OpusはSWE-Benchなど一部でリードする結果に。AIコーディング支援ツール選定の参考データとなる。
GoogleがGemini 3.1 Proの公開プレビューを開始した。Gemini 3シリーズを基盤とし、複雑な推論タスクやソフトウェア工学、エージェントワークフローに特化。100万トークン以上のコンテキストウィンドウを備え、GitHub CopilotやVertex AIなど複数プラットフォームで利用可能。
GoogleがGemini 3.1 ProをVertex AIなどでプレビュー公開した。複雑な問題解決を目的とし、推論能力が向上。ARC-AGI-2ベンチマークで77.1%を記録。開発者向けクォータ設定が先行して確認されている。
GoogleがGemini 3.1 Proを正式リリース。複雑なタスク向けに強化され、前モデル比2倍以上の性能を達成。開発者向けAPI、企業向けVertex AI、消費者向けアプリで順次展開が開始された。