GLM-5-Turbo利用制限が3倍に、非ピーク時は低コストで利用可能に
Z.aiが、開発者向けプラン「GLM Coding Plan」における最新モデル「GLM-5-Turbo」の利用制限を大幅に緩和した。期間限定で、非ピーク時間帯には従来モデル「GLM-4.7」と同等の低消費量で高性能モデルを利用できるようになる。ただし、この施策はあくまで期間限定のキャンペーンであり、特にピーク時間帯に依存する開発者は従来通りのコスト感覚で計画を立てる必要がある。
利用制限の3倍化と期間限定の低コスト施策
公式情報によれば、GLM Coding PlanにおけるGLM-5-Turboの利用制限(クォータ)が3倍に引き上げられた。これにより、同プランを契約する開発者は、これまでよりも大幅に多くのリクエストをGLM-5-Turboに対して行えるようになる。
さらに注目すべきは、2026年4月末までの期間限定で実施される特別措置だ。Z.aiの公式ドキュメントによると、北京時間(UTC+8)の14時から18時(ピーク時間帯)を除く時間帯では、GLM-5-Turboを利用しても消費クォータがGLM-4.7と同等の「1×」で計算される。ピーク時間帯は通常の消費量が適用されるため、コストを抑えたいユーザーは時間帯を意識した利用が有効となる。
各プランにおけるGLM-5シリーズの対応状況
Z.aiの提供する有料プランにおけるGLM-5シリーズの利用状況は、プランによって異なる。公式サイトの情報によれば、ProプランおよびMaxプランでは既にGLM-5およびGLM-5-Turboが利用可能となっている。
一方、エントリープランであるLiteプランについては、現時点ではGLM-5シリーズには対応していない。しかし、Z.aiは公式ドキュメントにおいて、Liteプランについて「4月中にできるだけ早く」GLM-5およびGLM-5-Turboに対応させる予定であることを明らかにしている。これにより、全ての有料プランユーザーが間もなく最新モデルにアクセスできる環境が整う見込みだ。
開発者への影響と戦略的な活用のすすめ
今回の発表は、GLM-5-Turboを高頻度で利用する開発者や、コストを抑えつつ最新モデルの性能を評価・テストしたいユーザーにとって大きな意味を持つ。非ピーク時間帯を中心に開発やバッチ処理を行うチームは、4月末までの間、実質的にGLM-4.7と変わらないコストで、より高性能なGLM-5-Turboを活用できる。
この施策は、ユーザーに新しいモデルを積極的に試してもらい、その性能と可能性を体感してもらうことを目的とした、一種のプロモーションと解釈できる。開発者側としては、この期間を利用して、GLM-5-Turboが自社のアプリケーションやサービスにもたらす具体的な価値(例えば、応答品質の向上、処理の効率化など)を検証し、今後の本格導入の判断材料とすることが得策だろう。
Z.aiが時間帯による差別化された料金体系を打ち出した点も特徴的である。これはクラウドリソースのピーク負荷を平準化するインセンティブとして機能すると同時に、ユーザーに対してコスト最適化の選択肢を提供するものだ。AIモデルの利用が日常化する中で、利用パターンに応じた柔軟な料金体系は、他のプロバイダーにも広がっていく可能性がある。
Be First to Comment