Akira

Posted on Jun 17 • Originally published at apidog.com

GLM-5.2とClaude Code、Cline、Cursorの使い方

GLM-5.2はZ.aiのオープンウェイトのコーディングモデルで、Claude Code、Cline、Cursorに接続できます。Claude CodeはAnthropic互換API、ClineとCursorはOpenAI互換エンドポイントを使うため、設定値が異なります。このガイドでは、GLMコーディングプランを前提に、3つの開発ハーネスへGLM-5.2を接続する手順をまとめます。

今すぐApidogを試す

モデル仕様を先に確認したい場合は、GLM-5.2概要とGLM-5.2 APIリファレンスを参照してください。この記事では、接続設定と動作確認に絞ります。

始める前に必要なもの

GLM-5.2は、約7530億パラメータのMixture-of-Expertsモデルで、100万トークンのコンテキストウィンドウ（正確には1,048,576トークン）を提供します。コーディング向けに設計されており、推論とエージェント的なツール使用に対応しています。Z.aiが公開した結果では、Terminal-Bench 2.1で81.0を記録し、GLM-5.1の62.0から向上しています。VentureBeatは、長期間のコーディングベンチマークにおいて、GPT-5.5を約6分の1のコストで上回ると評しました。

このガイドで必要なものは次のとおりです。

Z.aiアカウントとAPIキー
Claude Code、Cline（VS Code拡張機能）、Cursorのいずれか
Claude Codeで使う場合は、通常の従量課金キーではなく、GLMコーディングプランキー
モデルID：
- Claude Code：glm-5.2[1m]
- Cline / Cursor：glm-5.2

コストについては、標準APIが入力100万トークンあたり1.40ドル、出力100万トークンあたり4.40ドル（OpenRouterで確認）、キャッシュ入力は100万トークンあたり約0.26ドル（VentureBeatによる）です。GLMコーディングプランにはLite、Pro、Max、Teamの各ティアがあります。価格は変動するため、契約前にZ.aiで最新の価格を確認してください。

Claude CodeでGLM-5.2をセットアップする

Claude CodeはAnthropic互換エンドポイントと通信します。Z.aiはコーディングツール向けのAnthropic互換エンドポイントを提供しているため、環境変数で接続先を切り替えます。

シェルプロファイル（~/.zshrc、~/.bashrcなど）に以下を追加するか、Claude Code起動前にターミナルで実行します。

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

設定後、Claude Codeを起動します。

claude

Claude Code設定値のポイント

変数	値	目的
`ANTHROPIC_BASE_URL`	`https://api.z.ai/api/coding/paas/v4`	Claude Code用のAnthropic互換コーディングエンドポイント
`ANTHROPIC_API_KEY`	GLMコーディングプランキー	認証
`ANTHROPIC_DEFAULT_SONNET_MODEL`	`glm-5.2[1m]`	Sonnet相当のリクエストをGLM-5.2へルーティング
`ANTHROPIC_DEFAULT_OPUS_MODEL`	`glm-5.2[1m]`	Opus相当のリクエストをGLM-5.2へルーティング
`CLAUDE_CODE_AUTO_COMPACT_WINDOW`	`1000000`	1Mコンテキストを使い切る前に圧縮されるのを防ぐ
`API_TIMEOUT_MS`	`3000000`	長い推論・大規模コンテキスト処理のタイムアウトを避ける

ベースURLの注意点

Claude Codeでは、次のAnthropic互換コーディングエンドポイントを使います。

https://api.z.ai/api/coding/paas/v4

一部の資料では、以下のURLが記載されている場合があります。

https://open.z.ai/api/paas/v4

404や認証エラーが出る場合は、Z.ai GLM-5.2ドキュメントで現在の値を確認してください。

`glm-5.2[1m]`を使う理由

Claude Codeでは、1Mコンテキスト版を指定するために[1m]サフィックスを付けます。

glm-5.2[1m]

SonnetとOpusの両方を同じモデルにマッピングしておくと、Claude Codeがどのモデルティアを要求してもGLM-5.2へ接続されます。

タイムアウトを長くする理由

API_TIMEOUT_MS=3000000は3,000秒、つまり50分です。

1Mトークン級のコンテキストやMax推論を使うタスクでは、最初のトークンが返るまで時間がかかることがあります。デフォルトのタイムアウトのままだと、モデルが応答する前にClaude Code側でリクエストが切断される可能性があります。

推論努力の設定

GLM-5.2にはHighとMaxの2つの思考努力レベルがあります。Z.aiはコーディング用途ではMaxを推奨しています。

ハーネス側でreasoning_effortを渡せる場合は、難しいリファクタリングや長期タスクでは以下を指定します。

{
  "reasoning_effort": "max"
}

高速な補完や短い修正では、思考を無効化または軽量化する選択肢もあります。

以前のモデルから移行する場合は、Claude CodeでのGLM-5.1およびClaude CodeでのGLM-4.5と同じ構造で、モデルIDとベースURLだけを置き換えます。

ClineでGLM-5.2をセットアップする

Clineは、VS Code内で自律的なコーディングエージェントを実行する拡張機能です。Claude Codeとは異なり、OpenAI互換エンドポイントを使います。

手順は次のとおりです。

VS Code MarketplaceからCline拡張機能をインストールする
Clineパネルの歯車アイコンから設定を開く
APIプロバイダーでOpenAI互換を選択する
ベースURLに以下を入力する

   https://api.z.ai/api/paas/v4/

APIキーにZ.aiのAPIキーを貼り付ける
モデルIDに以下を入力する

   glm-5.2

コンテキストウィンドウを以下に設定する

Clineでは[1m]サフィックスは不要です。モデルIDはglm-5.2を使い、コンテキスト長はCline側のUIで設定します。

Clineは1つのタスクで多数のツール呼び出し、差分、コマンド実行結果を扱います。コンテキストウィンドウが小さいままだと、以前の計画やテスト結果が早く破棄されます。GLM-5.2の長いコンテキストを活かすため、1000000に設定しておきます。

CursorでGLM-5.2をセットアップする

CursorはAIファーストのスタンドアロンエディターです。こちらもOpenAI互換形式を使うため、Clineと近い設定になります。

設定手順は次のとおりです。

Cursorの設定を開く
Modelsに移動する
OpenAI APIキーのセクションまでスクロールする
カスタムベースURLまたはOpenAIベースURLを上書きを有効にする
ベースURLに以下を入力する

   https://api.z.ai/api/paas/v4/

Z.aiのAPIキーを入力する
カスタムモデルとして以下を追加する

   glm-5.2

追加したモデルをアクティブにする
CursorのAPIキーテストまたはチャットで接続を確認する

検証が通れば、GLM-5.2をCursorのチャット、インライン編集、コード生成で利用できます。

以前に他のGLMバージョンでCursorを使ったことがある場合、GLM-4.7とClaude Code vs Cursorで説明したトレードオフは引き続き有効です。Cursorはインライン編集に強く、Claude CodeとClineは多段階のエージェント実行に向いています。

並列設定

以下をコピーして、使用するハーネスに合わせて設定してください。

設定	Claude Code	Cline	Cursor
API形式	Anthropic互換	OpenAI互換	OpenAI互換
ベースURL	`https://api.z.ai/api/coding/paas/v4`	`https://api.z.ai/api/paas/v4/`	`https://api.z.ai/api/paas/v4/`
モデルID	`glm-5.2[1m]`	`glm-5.2`	`glm-5.2`
キーの種類	GLMコーディングプランキー	APIキー	APIキー
コンテキストウィンドウ	`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`	`1000000`	モデルのデフォルト
タイムアウト	`API_TIMEOUT_MS=3000000`	該当なし	該当なし
推論努力	Max推奨	プロバイダーのデフォルト	プロバイダーのデフォルト

特につまずきやすい点は次の2つです。

Claude CodeにOpenAI互換の一般APIベースURLを設定してしまう
Claude Codeでglm-5.2[1m]とAPI_TIMEOUT_MS=3000000を忘れる

実際のAPI呼び出しでセットアップをテストする

ハーネス側の設定を疑う前に、まず生のAPIリクエストでキーとモデルIDが有効か確認します。

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {"role": "user", "content": "Write a Python function that reverses a linked list."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "max",
    "stream": false
  }'

補完が返れば、APIキーとモデルIDは有効です。その場合、問題はClaude Code、Cline、Cursor側の設定にあります。

APIリクエストを継続的に検証したい場合は、Apidogを使うと、リクエストを保存し、ANTHROPIC_API_KEYやAuthorizationヘッダーを環境変数として管理できます。Apidogをダウンロードすれば、上記のcurlを直接インポートして再実行できます。

どのハーネスを使うべきか

用途別に選ぶと次のようになります。

Claude Code
- ターミナル中心で作業したい場合
- 大規模リファクタリングやリポジトリ全体の変更を任せたい場合
- glm-5.2[1m]で1Mコンテキストを明示的に使いたい場合
Cline
- VS Code内でエージェントを実行したい場合
- ファイル編集、コマンド実行、ツール呼び出しを確認しながら進めたい場合
- 自律実行とエディター内作業のバランスを取りたい場合
Cursor
- インライン編集やチャット補助を中心に使いたい場合
- セットアップを軽くしたい場合
- 既存のCursorワークフローにGLM-5.2を追加したい場合

プラン間の詳細な比較は、Claude Code vs Codex vs Cursor vs MiniMax vs GLM Planを参照してください。

GLM-5.2と他モデルの比較は、GLM-5.2 vs GPT-5.5、Claude Opus、およびGeminiとベンチマーク詳細を確認してください。アップグレード検討中の場合は、GLM-5.2 vs GLM-5.1で変更点を確認できます。

よくある質問

Claude Codeでは`glm-5.2[1m]`、ClineとCursorでは`glm-5.2`を使うのはなぜですか？

[1m]サフィックスは、Claude Codeのコーディングエンドポイントで1Mコンテキスト版を選択するための指定です。

ClineとCursorはOpenAI互換エンドポイントへ通常のモデルIDを渡すため、モデルIDはglm-5.2を使います。コンテキストウィンドウは、モデルIDではなくハーネス側の設定で扱います。

Claude Codeが長いタスクでタイムアウトする場合は？

API_TIMEOUT_MS=3000000を設定してください。

export API_TIMEOUT_MS=3000000

大規模コンテキストやMax推論では、応答開始までに時間がかかることがあります。この設定がないと、モデルが返答する前にClaude Codeがリクエストを中断する可能性があります。

GLMコーディングプランは必須ですか？

Claude Codeのコーディングエンドポイントでは、GLMコーディングプランキーが想定されています。

従量課金APIも利用できますが、日常的にコーディング用途で多く使う場合は、Lite、Pro、Max、Teamのような月額ティアのほうが扱いやすい場合があります。価格は変動するため、Z.aiで最新のティア価格を確認してください。

Claude Codeの正しいベースURLはどれですか？

まずは以下を使います。

https://api.z.ai/api/coding/paas/v4

一部のソースでは以下が記載されています。

https://open.z.ai/api/paas/v4

認証エラーや404が出る場合は、もう一方を試し、Z.aiドキュメントで最新の値を確認してください。

ClineとCursorでは、次の一般APIベースURLを使います。

https://api.z.ai/api/paas/v4/

GLM-5.2は画像を扱えますか？

GLM-5.2にビジョン対応バリアントは確認されていません。テキスト入力・テキスト出力のコーディングおよび推論モデルとして扱ってください。Z.aiがリリースするまでは、「GLM-5.2V」のような画像対応版を前提にしないほうが安全です。

まとめ

GLM-5.2をClaude Code、Cline、Cursorで使う場合は、ハーネスごとにAPI形式とモデルIDを正しく分ける必要があります。

Claude Code：
- https://api.z.ai/api/coding/paas/v4
- glm-5.2[1m]
- CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
- API_TIMEOUT_MS=3000000
Cline：
- https://api.z.ai/api/paas/v4/
- glm-5.2
- コンテキストウィンドウを1000000に設定
Cursor：
- https://api.z.ai/api/paas/v4/
- glm-5.2
- カスタムモデルとして追加

ハーネスなしで試したい場合は、GLM-5.2を無料で使う方法とGLM-5.2の料金内訳を参照してください。ローカルで使う場合は、Hugging Faceからウェイトを取得するか、Ollamaでモデルをプルできます。

DEV Community

GLM-5.2とClaude Code、Cline、Cursorの使い方

始める前に必要なもの

Claude CodeでGLM-5.2をセットアップする

Claude Code設定値のポイント

ベースURLの注意点

`glm-5.2[1m]`を使う理由

タイムアウトを長くする理由

推論努力の設定

ClineでGLM-5.2をセットアップする

CursorでGLM-5.2をセットアップする

並列設定

実際のAPI呼び出しでセットアップをテストする

どのハーネスを使うべきか

よくある質問

Claude Codeでは`glm-5.2[1m]`、ClineとCursorでは`glm-5.2`を使うのはなぜですか？

Claude Codeが長いタスクでタイムアウトする場合は？

GLMコーディングプランは必須ですか？

Claude Codeの正しいベースURLはどれですか？

GLM-5.2は画像を扱えますか？

まとめ

Top comments (0)

始める前に必要なもの

Claude CodeでGLM-5.2をセットアップする

Claude Code設定値のポイント

ベースURLの注意点

glm-5.2[1m]を使う理由

タイムアウトを長くする理由

推論努力の設定

ClineでGLM-5.2をセットアップする

CursorでGLM-5.2をセットアップする

並列設定

実際のAPI呼び出しでセットアップをテストする

どのハーネスを使うべきか

よくある質問

Claude Codeではglm-5.2[1m]、ClineとCursorではglm-5.2を使うのはなぜですか？

Claude Codeが長いタスクでタイムアウトする場合は？

GLMコーディングプランは必須ですか？

Claude Codeの正しいベースURLはどれですか？

GLM-5.2は画像を扱えますか？

まとめ

`glm-5.2[1m]`を使う理由

Claude Codeでは`glm-5.2[1m]`、ClineとCursorでは`glm-5.2`を使うのはなぜですか？