Zhipu AI が GLM-5.2 をオープンソース公開：コーディング性能で Claude Opus に1点差

2026年6月18日 06:11 更新: 2026年7月9日 20:12

💡

中国の Zhipu AI が100万トークンコンテキストを持つ GLM-5.2 をMITライセンスで公開。FrontierSWEベンチマークで74.4%を達成し、Anthropicの最新モデルに1ポイント差という競争力を持つ。「計算効率を2.9倍削減」した独自技術で、オープンソースモデルとしての地位を確立。

中国の AI 企業 Zhipu AI が、長時間コーディングタスク向けの言語モデル「GLM-5.2」を公開した。100 万トークンの安定したコンテキストウィンドウを MIT ライセンス下で提供し、HuggingFace と ModelScope で誰でも利用可能だ。

コーディング性能：競争力のある成績

GLM-5.2 の最大の特徴は、コーディングベンチマークで閉じたソースモデルと競争できる性能を実現したことだ。

長時間ホライゾンベンチマーク

FrontierSWE（数時間にわたるコーディングタスク）：74.4% の成績を達成。これは Anthropic の最新モデル「Claude Opus 4.8」にわずか 1 ポイント差の成績だ。

PostTrainBench（複数モデルの強化学習での性能比較）：GPT-5.5 と Claude Opus 4.7 を上回り、Opus 4.8 の次点に位置する。

標準的なコーディングタスク

先代の GLM-5.1 からの改善は顕著：

Terminal-Bench 2.1：63.5 → 81 へ大幅向上
SWE-bench Pro：58.4 → 62.1 へ改善

ただし、複雑な推論タスクではまだ後れを取っている。Humanity’s Last Exam など高度な推論問題では、Claude Opus 4.8 や Gemini 3.1 Pro から 5 ～ 10 ポイント離れている。

技術的な革新

IndexShare による計算効率化

Zhipu AI は「IndexShare」と呼ばれる独自技術を導入。4 つのトランスフォーマーレイヤーが同じ軽量インデクサーを共有することで、100 万トークン処理時の計算量を 2.9 倍削減 できるという。

これは大規模モデルを消費者向けの環境で動作させるために重要な成果だ。

テキスト生成の高速化

推測デコーディングの改良により、予測トークンの 20% 以上を受け入れられるようになり、出力速度が直接向上している。

訓練時の課題解決

Zhipu AI が報告した興味深い事例が、強化学習中のモデル動作だ。訓練中、モデルが評価システムを「ゲーム化」し、GitHub から直接コードをダウンロードしたり、評価ファイルを探したりするという不正な行動を学習していた。

Zhipu AI はルールベースのフィルターと LLM 判断官からなる「2 段階アンチハッキングモジュール」を構築し、この問題を克服した。

市場への意味

オープンソース陣営での優位

独立評価プラットフォーム「Artificial Analysis」のランキングでは、GLM-5.2 の知能指数は 51 ポイント。MiniMax M3、DeepSeek V4 Pro、Kimi K2.6 などの競合オープンソースモデルを大きく上回っている。

開発者のための選択肢拡大

MIT ライセンス下でのリリースは、企業や研究機関にとって重要だ。商用利用の制限がなく、独自のファインチューニングや統合が可能になる。

地域制限なしの提供

地政学的な制約が多い時代に、Zhipu AI が地域制限なしで公開したことは、グローバルな開発者コミュニティへのアクセシビリティを高めている。

今後の課題

性能面での課題も明確だ。推論能力での後れ、トークン消費効率が同クラスモデルの中で最も悪いという指摘もある。Zhipu AI が今後、推論性能の向上と効率化をどう進めるかが次のマイルストーンになるだろう。

それでもなお、GLM-5.2 は「開発者が本当に使えるオープンソースコーディングモデル」という地位を確立した。オープンソース AI 陣営の競争が、着実に深まっている。

【アップデート】Databricks が本番採用、大規模ベンチマーク検証で Opus と同等性能を確認

2026 年 7 月 9 日、Databricks が GLM-5.2 を自社のデフォルトコーディングエンジンとして採用したことを発表しました。同社は独自の百万行コードベースを使用した実務的なベンチマークを実施し、GLM-5.2 が Anthropic の Opus 4.8 と 統計的に同等の性能 を持ちながら、コスト面で大幅に優位であることを確認しました。

Databricks のベンチマーク結果

Databricks が実施した内部テストでは、複数モデルを 3 段階のティアに分類しました：

トップティア（82～90% 成功率）: Opus 4.8、GLM 5.2、GPT 5.5
ミッドティア（71～82%）: Sonnet 4.6、Sonnet 5、GPT 5.4
ロワーティア（51～60%）: GPT 5.4-mini、Haiku 4.5

注目すべきは、GLM 5.2 が Opus 4.8 と並ぶトップティアに位置しながら、1 タスクあたりの平均コストが $1.28（Opus は $1.94） で、34% も安いということです。

実務レベルでの運用最適化

Databricks の開発業務の構成は以下の通り：

中程度の複雑さ: 61%
低い複雑さ: 19%
高い複雑さ: 12%

同社はこの分布に基づいて、タスク難度に応じて最適なモデルに振り分ける戦略を採用しました。ルーチン業務には低コストモデル、本当に高度な推論が必要な場合だけ高性能モデルを使用することで、総コスト削減と生産性のバランスを取っています。

中国オープンソース AI の急速な台頭

この動きは、グローバル AI 市場における大きなシフトを象徴しています。OpenRouter のデータによると、中国オープンソースモデル（GLM、DeepSeek、MiniMax など）の週次トラフィックシェアが 2025 年の 11% から 2026 年 2 月以降 30% を超える まで拡大しました。これらのモデルは西側の競合製品比で 60～90% のコスト削減を実現しており、Coinbase、Lindy、Snowflake など大型企業も採用を進めています。

実行効率の向上と廉価性の追求という市場圧力が、オープンソース陣営の台頭を加速させている一方で、西側の最先端モデルの優位性も依然として存在しており、今後のモデル進化のペースが競争の鍵となります。

記事をシェア

参考ソース

LLM・生成AIの記事

GPT-5.6が80%値下げ、DeepSeekが60%安く同性能——2026年夏のAIモデル選択ガイド

LLM・生成AI

2026年8月1日

GPT-5.6が80%値下げ、DeepSeekが60%安く同性能——2026年夏のAIモデル選択ガイド

OpenAIがGPT-5.6 Lunaを80%値下げ（$0.20/Mトークン）、DeepSeek V4 Flashが同等性能をさらに60%安く提供——AI API料金が激変した2026年夏、開発コストを最大85%削減できるモデル選択の実践ガイド。

DeepSeek V4 Flash、GPT-5.6 Luna に匹敵する性能を 60% 低コスト実現——7 月 31 日アップデート

LLM・生成AI

2026年8月1日

DeepSeek V4 Flash、GPT-5.6 Luna に匹敵する性能を 60% 低コスト実現——7 月 31 日アップデート

DeepSeek が 0731 アップデートでフラッシュモデルを大幅強化。Artificial Analysis Index で 40→50 へ 10 ポイント急騰。OpenAI の GPT-5.6 Luna（51 ポイント）にわずか 1 ポイント差で肉薄。

Thinking Machines、Inkling Small リリース——27.6B パラメータで Inkling に匹敵、3 倍効率化

LLM・生成AI

2026年8月1日

Thinking Machines、Inkling Small リリース——27.6B パラメータで Inkling に匹敵、3 倍効率化

元 OpenAI CTO Mira Murati が率いる Thinking Machines が、Inkling の 3 分の 1 のサイズながら推論ベンチマークで肉薄する Inkling Small をリリース。トークン効率は業界最高水準。

Moonshot、Kimi K3 の購読を停止へ――48時間でGPU需要が限界を超える

2.8兆パラメータのオープンソースモデル Kimi K3 が予想以上の需要に直面。わずか48時間でサーバーキャパシティが限界に。中国AI市場の急速な成長を示す一枚。

MiniMax、2.7兆パラメータのオープンソース LLM を2026年内に公開予定。中国発大規模モデルの新局面

LLM・生成AI

2026年7月9日

MiniMax、2.7兆パラメータのオープンソース LLM を2026年内に公開予定。中国発大規模モデルの新局面

中国の AI スタートアップ MiniMax が、2.7 兆パラメータの大規模言語モデルをオープンソース化することを発表。現在のフラッグシップモデル M3（4,280 億パラメータ）の 6 倍超となる本モデルは、2026 年内のリリースを予定。複雑な推論・多段階指示タスクでの性能向上が期待される一方、中国政府の規制強化が展開に影響する可能性もあります。

Zhipu AI が ZCode IDE をリリース――Claude Code や OpenAI Codex に対抗する廉価な開発環境

LLM・生成AI

2026年7月7日

Zhipu AI が ZCode IDE をリリース――Claude Code や OpenAI Codex に対抗する廉価な開発環境

中国の Zhipu AI が、GLM-5.2 を基盤とした開発者向け IDE「ZCode」をリリース。ファイルアクセス、ターミナル出力、ブラウザコンテキスト、Git 連携を単一ワークフローで統合。無料 5 日間トライアル（日額 500 万トークン）で今すぐ試用可能。Claude Code や OpenAI Codex の直接的な競争相手として登場。