Anthropicが2026年2月5日、Claude Opus 4.6を正式リリース。最大100万トークンのコンテキストウィンドウ(ベータ)と複数AIエージェントの連携機能「エージェントチーム」を搭載。コーディング能力も改善され、主要クラウドプラットフォームでも利用可能に。
カテゴリー: AIモデル・研究
AnthropicがClaude Opus 4.6を2026年2月5日に正式リリースした。一方、Twitterで話題の「2026年リリースAIモデルリスト」には、GPT-5.3-CodexやGemini 3 Deep Thinkなど、公式発表が確認できないモデルが多数含まれている。
2026年2月上旬、中国のAIラボが相次いで高性能オープンソースモデルを公開。MiniMax M2.5はGPT-5等の1/10〜1/20の低コストで、Zhipu GLM-5は事実性評価で最高スコアを記録。両モデルともMoEアーキテクチャを採用しMITライセンスで提供される。
GoogleがGemini 3 Deep Thinkをリリース。競技プログラミングサイトCodeforcesで人間のトップレベルに匹敵するElo 3455を記録し、学術的推論ベンチマークでも高スコアを達成。Google AI Ultraプラン加入者がGeminiアプリで利用可能。
ACE-Step-v1.5 (2B)がオープンソースで公開された。消費電力4GB未満のGPUでローカル実行可能で、A100では2秒以内に楽曲を生成。LoRAファインチューニング対応、SUNOを上回る評価スコアを記録している。
Moonshot AIがオープンソースで公開したKimi K2.5が、OpenRouter経由で利用できるエージェントフレームワーク「OpenClaw」上で最も使用されているモデルとなった。公式情報によれば、Claude Opus 4.5をアジェンティックベンチマークで上回る性能を示している。
中国AI企業MiniMaxが新モデル「M2.5」をリリース。公式発表によれば、Claude Opusと同等の性能を維持しつつ、処理速度の向上と大幅なコスト削減を実現。エージェントシナリオや長文処理などの高度な機能に対応している。
オープンウェイトモデルGLM-5が、Artificial Analysis Intelligence IndexでClaude Opus 4.5と同点の50を記録し、ベンチマークではトップクラスの性能を示した。一方で、Twitter上の検証では実務的なコーディングタスクでの課題が指摘されており、ベンチマークスコアと実用性の評価に乖離が見られる。
AnthropicがClaude Opus 4.6を正式リリース。コード能力、計画立案、エージェントタスクの改善を図り、最大100万トークンのコンテキストウィンドウ(β)を搭載。大規模コードベースでの運用を想定したアップデートで、Sonnet 5の情報とは別のリリースであることを公式が確認。