オープンウェイトモデルGLM-5が、Artificial Analysis Intelligence IndexでClaude Opus 4.5と同点の50を記録し、ベンチマークではトップクラスの性能を示した。一方で、Twitter上の検証では実務的なコーディングタスクでの課題が指摘されており、ベンチマークスコアと実用性の評価に乖離が見られる。Read the postGLM-5、ベンチマークではClaude並みも実用性に課題? 検証結果を分析