XでDeepSeek V4のベンチマークリークが話題。SWE-Bench Verifiedで83.7%を記録し、現行トップのClaude Opus 4.5(80.9%)を上回ると主張。しかし、DeepSeek公式はV4を発表しておらず、リーク情報の信頼性は現時点で不明。Read the postDeepSeek V4のベンチマークリーク、SWE-Bench Verifiedで83.7%の驚異的スコアか
DeepSeek V4が2026年2月リリース予定とのリーク情報が複数ソースで確認。コーディングベンチマークでClaude/GPTを超える性能と100万トークン対応が噂されるが、公式発表は未だなし。現時点では全て推測情報。Read the postDeepSeek V4のリーク情報:HumanEval 90%超えの噂、2026年2月リリース予定か