OpenAIが発表したGPT-5.4が、Vibe Code Benchで67.42%の総合精度を記録し首位を獲得した。このベンチマークは、短いテキスト仕様から完全に動作するアプリケーションを生成するモデルの能力を測定する。前回の最高スコアを5.65ポイント上回る結果となった。
タグ: AI開発
AnthropicがClaude Sonnet 4.6をリリース。コーディングや長文脈処理などで性能向上。Kilo.aiを含む複数プラットフォームで利用可能となった。TwitterではKilo.ai限定の無料プロモーションが話題となっている。
Twitterで話題となった、AIツールを活用したRobloxゲーム開発の費用内訳(約2.2万円)を基に、公式情報を交えてAIによるゲーム開発の現状を分析。複数の生成AIツールを組み合わせた低コスト開発の可能性と、その実現性について検証する。
開発者のAlex Finn氏が、複数台の512GB Mac Studioを用いて、世界で最も強力なAIモデル3つをローカル環境で稼働させている。Appleが3台目のMac Studioを貸与したことで実現したこのセットアップは、クラウドに依存せず電力コストのみで、プライバシーを保ったAIエージェント運用を可能にする。
SNSで「OpenClawのAPI費用を最大90%削減」という情報が話題になった。しかし、公式ソースでの確認が取れず、サービス自体の実在が疑わしい。AI関連の費用削減情報は、必ず公式発表や信頼できるメディアで事実確認することが重要だ。
XAIが開発するAI「Grok」の新バージョン「Grok 4.2」の公開ベータが開始された。イーロン・マスク氏は、前バージョンと比較して「桁違いにより賢く、より高速」と述べている。公開ベータを通じてユーザーフィードバックを収集し、日々の改善を進めている。
OpenAIが、ウイルス的に人気を博したAI個人アシスタント「OpenClaw」の開発者、Peter Steinberger氏を迎え入れた。Steinberger氏は次世代の個人エージェント開発を推進する。既存のOpenClawプロジェクトはオープンソースとして継続される。
AnthropicがClaude Opus 4.6を2026年2月5日に正式リリースした。一方、Twitterで話題の「2026年リリースAIモデルリスト」には、GPT-5.3-CodexやGemini 3 Deep Thinkなど、公式発表が確認できないモデルが多数含まれている。
AppleがXcode 26.3でAnthropicのClaude Agent SDKを直接統合した。開発者はiPhoneからApple Vision Proまでの全Appleプラットフォーム向けに、サブエージェントやバックグラウンドタスク、プラグインを含むClaude Agentの全機能をXcode内で利用できるようになる。