GLM-5.2はZ.aiのオープンウェイトのコーディングモデルで、Claude Code、Cline、Cursorに接続できます。Claude CodeはAnthropic互換API、ClineとCursorはOpenAI互換エンドポイントを使うため、設定値が異なります。このガイドでは、GLMコーディングプランを前提に、3つの開発ハーネスへGLM-5.2を接続する手順をまとめます。
モデル仕様を先に確認したい場合は、GLM-5.2概要とGLM-5.2 APIリファレンスを参照してください。この記事では、接続設定と動作確認に絞ります。
始める前に必要なもの
GLM-5.2は、約7530億パラメータのMixture-of-Expertsモデルで、100万トークンのコンテキストウィンドウ(正確には1,048,576トークン)を提供します。コーディング向けに設計されており、推論とエージェント的なツール使用に対応しています。Z.aiが公開した結果では、Terminal-Bench 2.1で81.0を記録し、GLM-5.1の62.0から向上しています。VentureBeatは、長期間のコーディングベンチマークにおいて、GPT-5.5を約6分の1のコストで上回ると評しました。
このガイドで必要なものは次のとおりです。
- Z.aiアカウントとAPIキー
- Claude Code、Cline(VS Code拡張機能)、Cursorのいずれか
- Claude Codeで使う場合は、通常の従量課金キーではなく、GLMコーディングプランキー
- モデルID:
- Claude Code:
glm-5.2[1m] - Cline / Cursor:
glm-5.2
- Claude Code:
コストについては、標準APIが入力100万トークンあたり1.40ドル、出力100万トークンあたり4.40ドル(OpenRouterで確認)、キャッシュ入力は100万トークンあたり約0.26ドル(VentureBeatによる)です。GLMコーディングプランにはLite、Pro、Max、Teamの各ティアがあります。価格は変動するため、契約前にZ.aiで最新の価格を確認してください。
Claude CodeでGLM-5.2をセットアップする
Claude CodeはAnthropic互換エンドポイントと通信します。Z.aiはコーディングツール向けのAnthropic互換エンドポイントを提供しているため、環境変数で接続先を切り替えます。
シェルプロファイル(~/.zshrc、~/.bashrcなど)に以下を追加するか、Claude Code起動前にターミナルで実行します。
export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
設定後、Claude Codeを起動します。
claude
Claude Code設定値のポイント
| 変数 | 値 | 目的 |
|---|---|---|
ANTHROPIC_BASE_URL |
https://api.z.ai/api/coding/paas/v4 |
Claude Code用のAnthropic互換コーディングエンドポイント |
ANTHROPIC_API_KEY |
GLMコーディングプランキー | 認証 |
ANTHROPIC_DEFAULT_SONNET_MODEL |
glm-5.2[1m] |
Sonnet相当のリクエストをGLM-5.2へルーティング |
ANTHROPIC_DEFAULT_OPUS_MODEL |
glm-5.2[1m] |
Opus相当のリクエストをGLM-5.2へルーティング |
CLAUDE_CODE_AUTO_COMPACT_WINDOW |
1000000 |
1Mコンテキストを使い切る前に圧縮されるのを防ぐ |
API_TIMEOUT_MS |
3000000 |
長い推論・大規模コンテキスト処理のタイムアウトを避ける |
ベースURLの注意点
Claude Codeでは、次のAnthropic互換コーディングエンドポイントを使います。
https://api.z.ai/api/coding/paas/v4
一部の資料では、以下のURLが記載されている場合があります。
https://open.z.ai/api/paas/v4
404や認証エラーが出る場合は、Z.ai GLM-5.2ドキュメントで現在の値を確認してください。
glm-5.2[1m]を使う理由
Claude Codeでは、1Mコンテキスト版を指定するために[1m]サフィックスを付けます。
glm-5.2[1m]
SonnetとOpusの両方を同じモデルにマッピングしておくと、Claude Codeがどのモデルティアを要求してもGLM-5.2へ接続されます。
タイムアウトを長くする理由
API_TIMEOUT_MS=3000000は3,000秒、つまり50分です。
1Mトークン級のコンテキストやMax推論を使うタスクでは、最初のトークンが返るまで時間がかかることがあります。デフォルトのタイムアウトのままだと、モデルが応答する前にClaude Code側でリクエストが切断される可能性があります。
推論努力の設定
GLM-5.2にはHighとMaxの2つの思考努力レベルがあります。Z.aiはコーディング用途ではMaxを推奨しています。
ハーネス側でreasoning_effortを渡せる場合は、難しいリファクタリングや長期タスクでは以下を指定します。
{
"reasoning_effort": "max"
}
高速な補完や短い修正では、思考を無効化または軽量化する選択肢もあります。
以前のモデルから移行する場合は、Claude CodeでのGLM-5.1およびClaude CodeでのGLM-4.5と同じ構造で、モデルIDとベースURLだけを置き換えます。
ClineでGLM-5.2をセットアップする
Clineは、VS Code内で自律的なコーディングエージェントを実行する拡張機能です。Claude Codeとは異なり、OpenAI互換エンドポイントを使います。
手順は次のとおりです。
- VS Code MarketplaceからCline拡張機能をインストールする
- Clineパネルの歯車アイコンから設定を開く
- APIプロバイダーでOpenAI互換を選択する
- ベースURLに以下を入力する
https://api.z.ai/api/paas/v4/
- APIキーにZ.aiのAPIキーを貼り付ける
- モデルIDに以下を入力する
glm-5.2
- コンテキストウィンドウを以下に設定する
1000000
Clineでは[1m]サフィックスは不要です。モデルIDはglm-5.2を使い、コンテキスト長はCline側のUIで設定します。
Clineは1つのタスクで多数のツール呼び出し、差分、コマンド実行結果を扱います。コンテキストウィンドウが小さいままだと、以前の計画やテスト結果が早く破棄されます。GLM-5.2の長いコンテキストを活かすため、1000000に設定しておきます。
CursorでGLM-5.2をセットアップする
CursorはAIファーストのスタンドアロンエディターです。こちらもOpenAI互換形式を使うため、Clineと近い設定になります。
設定手順は次のとおりです。
- Cursorの設定を開く
- Modelsに移動する
- OpenAI APIキーのセクションまでスクロールする
- カスタムベースURLまたはOpenAIベースURLを上書きを有効にする
- ベースURLに以下を入力する
https://api.z.ai/api/paas/v4/
- Z.aiのAPIキーを入力する
- カスタムモデルとして以下を追加する
glm-5.2
- 追加したモデルをアクティブにする
- CursorのAPIキーテストまたはチャットで接続を確認する
検証が通れば、GLM-5.2をCursorのチャット、インライン編集、コード生成で利用できます。
以前に他のGLMバージョンでCursorを使ったことがある場合、GLM-4.7とClaude Code vs Cursorで説明したトレードオフは引き続き有効です。Cursorはインライン編集に強く、Claude CodeとClineは多段階のエージェント実行に向いています。
並列設定
以下をコピーして、使用するハーネスに合わせて設定してください。
| 設定 | Claude Code | Cline | Cursor |
|---|---|---|---|
| API形式 | Anthropic互換 | OpenAI互換 | OpenAI互換 |
| ベースURL | https://api.z.ai/api/coding/paas/v4 |
https://api.z.ai/api/paas/v4/ |
https://api.z.ai/api/paas/v4/ |
| モデルID | glm-5.2[1m] |
glm-5.2 |
glm-5.2 |
| キーの種類 | GLMコーディングプランキー | APIキー | APIキー |
| コンテキストウィンドウ | CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 |
1000000 |
モデルのデフォルト |
| タイムアウト | API_TIMEOUT_MS=3000000 |
該当なし | 該当なし |
| 推論努力 | Max推奨 | プロバイダーのデフォルト | プロバイダーのデフォルト |
特につまずきやすい点は次の2つです。
- Claude CodeにOpenAI互換の一般APIベースURLを設定してしまう
- Claude Codeで
glm-5.2[1m]とAPI_TIMEOUT_MS=3000000を忘れる
実際のAPI呼び出しでセットアップをテストする
ハーネス側の設定を疑う前に、まず生のAPIリクエストでキーとモデルIDが有効か確認します。
curl https://api.z.ai/api/paas/v4/chat/completions \
-H "Authorization: Bearer $ZAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.2",
"messages": [
{"role": "user", "content": "Write a Python function that reverses a linked list."}
],
"thinking": {"type": "enabled"},
"reasoning_effort": "max",
"stream": false
}'
補完が返れば、APIキーとモデルIDは有効です。その場合、問題はClaude Code、Cline、Cursor側の設定にあります。
APIリクエストを継続的に検証したい場合は、Apidogを使うと、リクエストを保存し、ANTHROPIC_API_KEYやAuthorizationヘッダーを環境変数として管理できます。Apidogをダウンロードすれば、上記のcurlを直接インポートして再実行できます。
どのハーネスを使うべきか
用途別に選ぶと次のようになります。
-
Claude Code
- ターミナル中心で作業したい場合
- 大規模リファクタリングやリポジトリ全体の変更を任せたい場合
-
glm-5.2[1m]で1Mコンテキストを明示的に使いたい場合
-
Cline
- VS Code内でエージェントを実行したい場合
- ファイル編集、コマンド実行、ツール呼び出しを確認しながら進めたい場合
- 自律実行とエディター内作業のバランスを取りたい場合
-
Cursor
- インライン編集やチャット補助を中心に使いたい場合
- セットアップを軽くしたい場合
- 既存のCursorワークフローにGLM-5.2を追加したい場合
プラン間の詳細な比較は、Claude Code vs Codex vs Cursor vs MiniMax vs GLM Planを参照してください。
GLM-5.2と他モデルの比較は、GLM-5.2 vs GPT-5.5、Claude Opus、およびGeminiとベンチマーク詳細を確認してください。アップグレード検討中の場合は、GLM-5.2 vs GLM-5.1で変更点を確認できます。
よくある質問
Claude Codeではglm-5.2[1m]、ClineとCursorではglm-5.2を使うのはなぜですか?
[1m]サフィックスは、Claude Codeのコーディングエンドポイントで1Mコンテキスト版を選択するための指定です。
ClineとCursorはOpenAI互換エンドポイントへ通常のモデルIDを渡すため、モデルIDはglm-5.2を使います。コンテキストウィンドウは、モデルIDではなくハーネス側の設定で扱います。
Claude Codeが長いタスクでタイムアウトする場合は?
API_TIMEOUT_MS=3000000を設定してください。
export API_TIMEOUT_MS=3000000
大規模コンテキストやMax推論では、応答開始までに時間がかかることがあります。この設定がないと、モデルが返答する前にClaude Codeがリクエストを中断する可能性があります。
GLMコーディングプランは必須ですか?
Claude Codeのコーディングエンドポイントでは、GLMコーディングプランキーが想定されています。
従量課金APIも利用できますが、日常的にコーディング用途で多く使う場合は、Lite、Pro、Max、Teamのような月額ティアのほうが扱いやすい場合があります。価格は変動するため、Z.aiで最新のティア価格を確認してください。
Claude Codeの正しいベースURLはどれですか?
まずは以下を使います。
https://api.z.ai/api/coding/paas/v4
一部のソースでは以下が記載されています。
https://open.z.ai/api/paas/v4
認証エラーや404が出る場合は、もう一方を試し、Z.aiドキュメントで最新の値を確認してください。
ClineとCursorでは、次の一般APIベースURLを使います。
https://api.z.ai/api/paas/v4/
GLM-5.2は画像を扱えますか?
GLM-5.2にビジョン対応バリアントは確認されていません。テキスト入力・テキスト出力のコーディングおよび推論モデルとして扱ってください。Z.aiがリリースするまでは、「GLM-5.2V」のような画像対応版を前提にしないほうが安全です。
まとめ
GLM-5.2をClaude Code、Cline、Cursorで使う場合は、ハーネスごとにAPI形式とモデルIDを正しく分ける必要があります。
-
Claude Code:
https://api.z.ai/api/coding/paas/v4glm-5.2[1m]CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000API_TIMEOUT_MS=3000000
-
Cline:
https://api.z.ai/api/paas/v4/glm-5.2- コンテキストウィンドウを
1000000に設定
-
Cursor:
https://api.z.ai/api/paas/v4/glm-5.2- カスタムモデルとして追加
ハーネスなしで試したい場合は、GLM-5.2を無料で使う方法とGLM-5.2の料金内訳を参照してください。ローカルで使う場合は、Hugging Faceからウェイトを取得するか、Ollamaでモデルをプルできます。



Top comments (0)