大規模言語モデル推論エンジン「vLLM」のv0.18.0がリリースされた。gRPCによるサービング、GPUを必要としないマルチモーダルレンダリング、FlashAttention 4バックエンド統合など多数の新機能を搭載。PyTorch 2.10.0へのアップグレードを含む破壊的変更も実施。
タグ: AI開発
AIコードアシスタント「Cursor」の新モデル「Composer 2」が、Moonshot AIの「Kimi K2.5」を強化学習(RL)でファインチューニングしたものである可能性が、API呼び出しの観測から指摘されている。公式発表はなく、コミュニティによる推測の段階。
AI開発プロジェクト「Zai_org」が、GLM-5-TurboのリリースとNVIDIA GTCを祝うキャンペーンをTwitterで実施。
公式発表やNVIDIA GTCでの関連情報は確認されていない。
キャンペーンは無料利用権のプレゼントを告知している。
AnthropicがClaude Opus 4.6を発表し、100万トークンのコンテキストウィンドウに対応した。3年前の9Kトークンから約111倍の進化で、新書5-6冊分相当の情報を一度に処理可能。ただし、100万トークン利用にはベータ設定が必要で、超過時は追加料金が発生する。
X(旧Twitter)上で、AIを活用した開発はシングルスレッドでも十分に高速であり、複数スレッドでの同時並行処理は不要という個人の見解が投稿された。これは特定の開発者の経験に基づく主張であり、公式な発表や広範な検証結果ではない。本記事ではこの主張をきっかけに、AI支援開発における最適なワークフローについて考察する。
OpenClawがXで「Hunter & Healer Alpha」の提供を発表。OpenRouter経由で最大100万コンテキストのモデルを無料で利用可能としている。GPT 5.4の思考中断問題の改善、Gemini Embedding 2のメモリ機能、OpenCodeのGo言語サポート、セキュリティ強化スプリントも含まれる。
Twitterで「Claude Opus 4.6は異常に高い」との声が話題に。公式情報を確認すると、Opus 4.6は前モデルと同額だが、他社の安価モデルと比べると確かに高額。用途に応じたモデル使い分けによるコスト最適化の提案が浮上している。
OpenAIが2026年3月5日にGPT-5.4をリリース。プロ向け作業のための高性能モデルとして、推論・コーディング能力が向上。発表直後からユーザーによる過剰な期待を含む活用事例が拡散しているが、公式発表内容とユーザー実証事例の間には注意深い検証が必要だ。
GoogleのGemini CLIがv0.32.1にアップデート。対話型シェルモードでのタブ補完機能が実装され、Planモードでは外部エディタ連携や複雑なワークフロー対応が強化された。MCPツールの進捗表示など細かな改善も含まれる。