カテゴリー: AIモデル・研究

2026年2月25日 / cloud9 / AIモデル・研究

GPT-5.3-CodexのAPI一般提供は誤報か？公式情報との齟齬を検証

OpenAI開発者向けアカウントがGPT-5.3-CodexのAPI一般提供開始をツイートしたが、公式情報ではAPIアクセスは「近日中に安全に有効化予定」とされており、現時点での全開発者向け即時利用は確認できない。情報の齟齬と実際の提供状況を整理する。

Read the post

2026年2月25日 / cloud9 / AIモデル・研究

MiniMax M2.5、コーディング性能でClaude Opus 4.6に匹敵価格は1/60以下

2026年2月リリースのMiniMax M2.5が、コーディングベンチマークでClaude Opus 4.6と同等の性能を達成。特にエージェントタスクで優位性を示す一方、価格はOpusの1/20〜1/60と大幅に安価。一般推論ではOpusが依然優位。

Read the post

2026年2月22日 / cloud9 / AIモデル・研究

Gemini 3.1 Proが論文からCRDTシミュレータを生成、長文タスク処理能力を実証

Twitterで話題となった動画では、Gemini 3.1 ProがCRDTに関する詳細な研究論文を読み込み、機能するローカルファースト型シミュレーションアプリを構築した。これは、同モデルが公式に謳う「複雑なシステムの統合」能力をユーザーが検証した一例であり、理論からデバッグ済みの対話型アプリへの橋渡しを長期的なタスクで実現したことを示している。

Read the post

2026年2月22日 / cloud9 / AIモデル・研究

NVIDIA「DreamDojo」世界モデル公開、4.4万時間の一人称動画で学習

NVIDIAがロボット向け世界モデル「DreamDojo」を発表。44,000時間の一人称視点動画で学習し、物理世界の行動結果を予測・シミュレーションする。蒸留後は約10FPSで1分以上の未来予測が可能。

Read the post

2026年2月21日 / cloud9 / AIモデル・研究

Gemini 3.1 Pro正式リリース、複雑なコーディングタスクに対応

GoogleがGemini 3.1 Proを正式リリースした。複雑なコーディング、多モード理解、エージェント機能に優れた最先端の推論モデル。一方、Twitterで話題のOpus 4.6との比較や、特定の3Dアプリ構築プロンプトに関する公式情報は現時点で確認されていない。

Read the post

2026年2月21日 / cloud9 / AIモデル・研究

Claude Opus 4.6 vs Gemini 3.1 Pro、最新AIモデル比較で見えたコーディング性能の実力差

GoogleがGemini 3.1 Proを発表し、推論性能が前モデル比2倍に向上。Claude Opus 4.6とのベンチマーク比較では、GeminiがARC-AGI-2やGPQA Diamondで優位、OpusはSWE-Benchなど一部でリードする結果に。AIコーディング支援ツール選定の参考データとなる。

Read the post

2026年2月20日 / cloud9 / AIモデル・研究

Gemini 3.1 Proが公開プレビュー開始、複雑なタスク向けに推論性能を強化

GoogleがGemini 3.1 Proの公開プレビューを開始した。Gemini 3シリーズを基盤とし、複雑な推論タスクやソフトウェア工学、エージェントワークフローに特化。100万トークン以上のコンテキストウィンドウを備え、GitHub CopilotやVertex AIなど複数プラットフォームで利用可能。

Read the post

2026年2月20日 / cloud9 / AIモデル・研究

Gemini 3.1 ProがVertex AIで早期プレビュー開始、複雑な推論タスクを強化

GoogleがGemini 3.1 ProをVertex AIなどでプレビュー公開した。複雑な問題解決を目的とし、推論能力が向上。ARC-AGI-2ベンチマークで77.1%を記録。開発者向けクォータ設定が先行して確認されている。

Read the post

2026年2月20日 / cloud9 / AIモデル・研究

Gemini 3.1 Pro正式リリース、複雑タスク性能が前モデルの2倍以上に

GoogleがGemini 3.1 Proを正式リリース。複雑なタスク向けに強化され、前モデル比2倍以上の性能を達成。開発者向けAPI、企業向けVertex AI、消費者向けアプリで順次展開が開始された。

Read the post

2026年2月19日 / cloud9 / AIモデル・研究

Grok 4.20公開ベータ版、4つのAIエージェントが協調する新アーキテクチャを採用

XAIがGrok 4.20の公開ベータ版を開始。新たな「ラーニングアーキテクチャ」を採用し、4つの専門化されたAIエージェントが並列で協調して回答を生成する仕組みを導入。エンジニアリング質問への回答能力が向上しているとされる。

Read the post