オープンウェイトモデルGLM-5が、Artificial Analysis Intelligence IndexでClaude Opus 4.5と同点の50を記録し、ベンチマークではトップクラスの性能を示した。一方で、Twitter上の検証では実務的なコーディングタスクでの課題が指摘されており、ベンチマークスコアと実用性の評価に乖離が見られる。
投稿者: cloud9
OpenAIがmacOS向け「Codex」アプリをリリース。複数のAIエージェントを並行して管理・作業できる開発ハブとして機能する。期間限定で無料ユーザーも利用可能で、Windows/Linux版も計画中。
ESP32-S3開発板(約5ドル)上で動作する個人AIアシスタント「MimiClaw」が公開された。OS不要のベアメタルC言語実装で、USB電源とWiFi接続後、Telegram経由で会話可能。ローカルメモリは持続し、再起動後も記憶を保持する。
オープンソースの音楽生成AI「ACE-Step 1.5」がリリースされた。RTX 3090でフルソングを10秒未満で生成可能で、4GB VRAM以下のハードウェアで動作する。MITライセンスで商用利用が可能とされている。
USDCがAIエージェント向けハッカソンを開催。賞金総額は3万ドルで、Agentic CommerceやOpenClaw Skillなど3つのトラックを設定。Lablab.aiプラットフォームで2月4日から19日まで実施される。
AnthropicがClaude Opus 4.6を正式リリース。コード能力、計画立案、エージェントタスクの改善を図り、最大100万トークンのコンテキストウィンドウ(β)を搭載。大規模コードベースでの運用を想定したアップデートで、Sonnet 5の情報とは別のリリースであることを公式が確認。
OpenAIが提供を開始したmacOS向けCodexデスクトップアプリは、複数のAIエージェントを並列で実行・管理できる機能を備えている。同一リポジトリ内で複数の開発タスクを競合させずに同時進行させることが可能で、外部ツール連携も強化されている。これは単なるコード補助ツールを超えた「エージェントのためのコマンドセンター」としての設計思想を示している。
Zhipu AIが新たなフラッグシップモデル「GLM-5」をリリース。Artificial Analysis Intelligence Index(低いほど良い)において、Claude Opus(約4.6)やGPT-5.x Codex(約5.3)を下回るスコアを記録し、コーディング能力でClaude Opusに接近する性能を示した。
AnthropicはClaudeの無料プランをアップグレードし、これまで有料版限定だったファイル作成(Word/Excel/PPT/PDF)、コネクタ選択、スキル設定などの4機能を無料ユーザーにも開放した。同社は無料版を含む全プランで広告表示の計画がないことも明言している。