Twitterで「Claude Opus 4.6が脆弱なコードを書き1.78億円損失」と話題になったが、公式情報では確認できず。実際のAnthropic研究は、管理された環境でのAIエージェントによる脆弱性発見・悪用シミュレーションであり、実案件での被害とは異なる。
カテゴリー: AIモデル・研究
X(旧Twitter)でGrok 4.20のリリースと4つのエージェント同時稼働機能が噂されている。しかし、公式ブログではGrok 4.1が最新であり、マスク氏の「数週間後」発言と実際のリリース状況にズレがある。現時点では限定的なベータテストの可能性が高い。
NVIDIAがリアルタイム双方向音声対話モデル「PersonaPlex-7B-v1」をオープンソースで公開。同時聞き取りと話し出しをサポートし、極めて低いラグでの自然な会話が可能。現在は英語専用で、Hugging FaceとGitHubから無料で入手できる。
アリババQwenチームが、Qwen3.5シリーズ初のオープンウェイトモデル「Qwen3.5-397B-A17B」を公開。ネイティブマルチモーダル(視覚言語)対応で、実世界エージェント向けに設計。ハイブリッド線形アテンションとスパースMoEを採用し、デコードスループットは前モデル比最大19倍。
Zhipu AIのGLM-4.7-Flash(30B MoEモデル)が、RTX 3090/4090(24GB VRAM)やApple Silicon(M3 Max)などのローカル環境で動作可能になった。公式情報ではM3 Maxで60-80 tok/sの速度を達成。Twitter上ではCPUオフロードによる高速化の報告もあるが、公式ソースでは未確認。
XでDeepSeek V4のベンチマークリークが話題。SWE-Bench Verifiedで83.7%を記録し、現行トップのClaude Opus 4.5(80.9%)を上回ると主張。しかし、DeepSeek公式はV4を発表しておらず、リーク情報の信頼性は現時点で不明。
アリババのQwenチームが、わずか3〜4秒の参照音声から高精度なボイスクローンが可能な音声生成AIモデル「Qwen3-TTS Family」をオープンソース公開した。モデルサイズは1.7Bと0.6Bで、低遅延(97ms)と多言語(日本語含む)対応が特徴。GitHubやHugging Faceで利用可能。
DeepSeek V4が2026年2月リリース予定とのリーク情報が複数ソースで確認。コーディングベンチマークでClaude/GPTを超える性能と100万トークン対応が噂されるが、公式発表は未だなし。現時点では全て推測情報。
イーロン・マスクがXで次期AIモデル「Grok 4.20」のリリースを「3〜4週間後」と発言。ただし公式発表はなく、一部で流れた「来週リリース」は誤情報。複数メディアが報じるも、現時点で具体的な仕様や性能は未公開。