DEV Community

Cover image for GLM-5.2とClaude Code、Cline、Cursorの使い方
Akira
Akira

Posted on • Originally published at apidog.com

GLM-5.2とClaude Code、Cline、Cursorの使い方

GLM-5.2はZ.aiのオープンウェイトのコーディングモデルで、Claude Code、Cline、Cursorに接続できます。Claude CodeはAnthropic互換API、ClineとCursorはOpenAI互換エンドポイントを使うため、設定値が異なります。このガイドでは、GLMコーディングプランを前提に、3つの開発ハーネスへGLM-5.2を接続する手順をまとめます。

今すぐApidogを試す

モデル仕様を先に確認したい場合は、GLM-5.2概要GLM-5.2 APIリファレンスを参照してください。この記事では、接続設定と動作確認に絞ります。

始める前に必要なもの

GLM-5.2は、約7530億パラメータのMixture-of-Expertsモデルで、100万トークンのコンテキストウィンドウ(正確には1,048,576トークン)を提供します。コーディング向けに設計されており、推論とエージェント的なツール使用に対応しています。Z.aiが公開した結果では、Terminal-Bench 2.1で81.0を記録し、GLM-5.1の62.0から向上しています。VentureBeatは、長期間のコーディングベンチマークにおいて、GPT-5.5を約6分の1のコストで上回ると評しました。

GLM-5.2 benchmark

このガイドで必要なものは次のとおりです。

  • Z.aiアカウントとAPIキー
  • Claude Code、Cline(VS Code拡張機能)、Cursorのいずれか
  • Claude Codeで使う場合は、通常の従量課金キーではなく、GLMコーディングプランキー
  • モデルID:
    • Claude Code:glm-5.2[1m]
    • Cline / Cursor:glm-5.2

コストについては、標準APIが入力100万トークンあたり1.40ドル、出力100万トークンあたり4.40ドル(OpenRouterで確認)、キャッシュ入力は100万トークンあたり約0.26ドル(VentureBeatによる)です。GLMコーディングプランにはLite、Pro、Max、Teamの各ティアがあります。価格は変動するため、契約前にZ.aiで最新の価格を確認してください。

Claude CodeでGLM-5.2をセットアップする

Claude CodeはAnthropic互換エンドポイントと通信します。Z.aiはコーディングツール向けのAnthropic互換エンドポイントを提供しているため、環境変数で接続先を切り替えます。

Claude Code setup

シェルプロファイル(~/.zshrc~/.bashrcなど)に以下を追加するか、Claude Code起動前にターミナルで実行します。

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Enter fullscreen mode Exit fullscreen mode

設定後、Claude Codeを起動します。

claude
Enter fullscreen mode Exit fullscreen mode

Claude Code設定値のポイント

変数 目的
ANTHROPIC_BASE_URL https://api.z.ai/api/coding/paas/v4 Claude Code用のAnthropic互換コーディングエンドポイント
ANTHROPIC_API_KEY GLMコーディングプランキー 認証
ANTHROPIC_DEFAULT_SONNET_MODEL glm-5.2[1m] Sonnet相当のリクエストをGLM-5.2へルーティング
ANTHROPIC_DEFAULT_OPUS_MODEL glm-5.2[1m] Opus相当のリクエストをGLM-5.2へルーティング
CLAUDE_CODE_AUTO_COMPACT_WINDOW 1000000 1Mコンテキストを使い切る前に圧縮されるのを防ぐ
API_TIMEOUT_MS 3000000 長い推論・大規模コンテキスト処理のタイムアウトを避ける

ベースURLの注意点

Claude Codeでは、次のAnthropic互換コーディングエンドポイントを使います。

https://api.z.ai/api/coding/paas/v4
Enter fullscreen mode Exit fullscreen mode

一部の資料では、以下のURLが記載されている場合があります。

https://open.z.ai/api/paas/v4
Enter fullscreen mode Exit fullscreen mode

404や認証エラーが出る場合は、Z.ai GLM-5.2ドキュメントで現在の値を確認してください。

glm-5.2[1m]を使う理由

Claude Codeでは、1Mコンテキスト版を指定するために[1m]サフィックスを付けます。

glm-5.2[1m]
Enter fullscreen mode Exit fullscreen mode

SonnetとOpusの両方を同じモデルにマッピングしておくと、Claude Codeがどのモデルティアを要求してもGLM-5.2へ接続されます。

タイムアウトを長くする理由

API_TIMEOUT_MS=3000000は3,000秒、つまり50分です。

1Mトークン級のコンテキストやMax推論を使うタスクでは、最初のトークンが返るまで時間がかかることがあります。デフォルトのタイムアウトのままだと、モデルが応答する前にClaude Code側でリクエストが切断される可能性があります。

推論努力の設定

GLM-5.2にはHighとMaxの2つの思考努力レベルがあります。Z.aiはコーディング用途ではMaxを推奨しています。

ハーネス側でreasoning_effortを渡せる場合は、難しいリファクタリングや長期タスクでは以下を指定します。

{
  "reasoning_effort": "max"
}
Enter fullscreen mode Exit fullscreen mode

高速な補完や短い修正では、思考を無効化または軽量化する選択肢もあります。

以前のモデルから移行する場合は、Claude CodeでのGLM-5.1およびClaude CodeでのGLM-4.5と同じ構造で、モデルIDとベースURLだけを置き換えます。

ClineでGLM-5.2をセットアップする

Clineは、VS Code内で自律的なコーディングエージェントを実行する拡張機能です。Claude Codeとは異なり、OpenAI互換エンドポイントを使います。

Cline setup

手順は次のとおりです。

  1. VS Code MarketplaceからCline拡張機能をインストールする
  2. Clineパネルの歯車アイコンから設定を開く
  3. APIプロバイダーOpenAI互換を選択する
  4. ベースURLに以下を入力する
   https://api.z.ai/api/paas/v4/
Enter fullscreen mode Exit fullscreen mode
  1. APIキーZ.aiのAPIキーを貼り付ける
  2. モデルIDに以下を入力する
   glm-5.2
Enter fullscreen mode Exit fullscreen mode
  1. コンテキストウィンドウを以下に設定する
   1000000
Enter fullscreen mode Exit fullscreen mode

Clineでは[1m]サフィックスは不要です。モデルIDはglm-5.2を使い、コンテキスト長はCline側のUIで設定します。

Clineは1つのタスクで多数のツール呼び出し、差分、コマンド実行結果を扱います。コンテキストウィンドウが小さいままだと、以前の計画やテスト結果が早く破棄されます。GLM-5.2の長いコンテキストを活かすため、1000000に設定しておきます。

CursorでGLM-5.2をセットアップする

CursorはAIファーストのスタンドアロンエディターです。こちらもOpenAI互換形式を使うため、Clineと近い設定になります。

Cursor setup

設定手順は次のとおりです。

  1. Cursorの設定を開く
  2. Modelsに移動する
  3. OpenAI APIキーのセクションまでスクロールする
  4. カスタムベースURLまたはOpenAIベースURLを上書きを有効にする
  5. ベースURLに以下を入力する
   https://api.z.ai/api/paas/v4/
Enter fullscreen mode Exit fullscreen mode
  1. Z.aiのAPIキーを入力する
  2. カスタムモデルとして以下を追加する
   glm-5.2
Enter fullscreen mode Exit fullscreen mode
  1. 追加したモデルをアクティブにする
  2. CursorのAPIキーテストまたはチャットで接続を確認する

検証が通れば、GLM-5.2をCursorのチャット、インライン編集、コード生成で利用できます。

以前に他のGLMバージョンでCursorを使ったことがある場合、GLM-4.7とClaude Code vs Cursorで説明したトレードオフは引き続き有効です。Cursorはインライン編集に強く、Claude CodeとClineは多段階のエージェント実行に向いています。

並列設定

以下をコピーして、使用するハーネスに合わせて設定してください。

設定 Claude Code Cline Cursor
API形式 Anthropic互換 OpenAI互換 OpenAI互換
ベースURL https://api.z.ai/api/coding/paas/v4 https://api.z.ai/api/paas/v4/ https://api.z.ai/api/paas/v4/
モデルID glm-5.2[1m] glm-5.2 glm-5.2
キーの種類 GLMコーディングプランキー APIキー APIキー
コンテキストウィンドウ CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 1000000 モデルのデフォルト
タイムアウト API_TIMEOUT_MS=3000000 該当なし 該当なし
推論努力 Max推奨 プロバイダーのデフォルト プロバイダーのデフォルト

特につまずきやすい点は次の2つです。

  • Claude CodeにOpenAI互換の一般APIベースURLを設定してしまう
  • Claude Codeでglm-5.2[1m]API_TIMEOUT_MS=3000000を忘れる

実際のAPI呼び出しでセットアップをテストする

ハーネス側の設定を疑う前に、まず生のAPIリクエストでキーとモデルIDが有効か確認します。

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {"role": "user", "content": "Write a Python function that reverses a linked list."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "max",
    "stream": false
  }'
Enter fullscreen mode Exit fullscreen mode

補完が返れば、APIキーとモデルIDは有効です。その場合、問題はClaude Code、Cline、Cursor側の設定にあります。

APIリクエストを継続的に検証したい場合は、Apidogを使うと、リクエストを保存し、ANTHROPIC_API_KEYAuthorizationヘッダーを環境変数として管理できます。Apidogをダウンロードすれば、上記のcurlを直接インポートして再実行できます。

どのハーネスを使うべきか

用途別に選ぶと次のようになります。

  • Claude Code

    • ターミナル中心で作業したい場合
    • 大規模リファクタリングやリポジトリ全体の変更を任せたい場合
    • glm-5.2[1m]で1Mコンテキストを明示的に使いたい場合
  • Cline

    • VS Code内でエージェントを実行したい場合
    • ファイル編集、コマンド実行、ツール呼び出しを確認しながら進めたい場合
    • 自律実行とエディター内作業のバランスを取りたい場合
  • Cursor

    • インライン編集やチャット補助を中心に使いたい場合
    • セットアップを軽くしたい場合
    • 既存のCursorワークフローにGLM-5.2を追加したい場合

プラン間の詳細な比較は、Claude Code vs Codex vs Cursor vs MiniMax vs GLM Planを参照してください。

GLM-5.2と他モデルの比較は、GLM-5.2 vs GPT-5.5、Claude Opus、およびGeminiベンチマーク詳細を確認してください。アップグレード検討中の場合は、GLM-5.2 vs GLM-5.1で変更点を確認できます。

よくある質問

Claude Codeではglm-5.2[1m]、ClineとCursorではglm-5.2を使うのはなぜですか?

[1m]サフィックスは、Claude Codeのコーディングエンドポイントで1Mコンテキスト版を選択するための指定です。

ClineとCursorはOpenAI互換エンドポイントへ通常のモデルIDを渡すため、モデルIDはglm-5.2を使います。コンテキストウィンドウは、モデルIDではなくハーネス側の設定で扱います。

Claude Codeが長いタスクでタイムアウトする場合は?

API_TIMEOUT_MS=3000000を設定してください。

export API_TIMEOUT_MS=3000000
Enter fullscreen mode Exit fullscreen mode

大規模コンテキストやMax推論では、応答開始までに時間がかかることがあります。この設定がないと、モデルが返答する前にClaude Codeがリクエストを中断する可能性があります。

GLMコーディングプランは必須ですか?

Claude Codeのコーディングエンドポイントでは、GLMコーディングプランキーが想定されています。

従量課金APIも利用できますが、日常的にコーディング用途で多く使う場合は、Lite、Pro、Max、Teamのような月額ティアのほうが扱いやすい場合があります。価格は変動するため、Z.aiで最新のティア価格を確認してください。

Claude Codeの正しいベースURLはどれですか?

まずは以下を使います。

https://api.z.ai/api/coding/paas/v4
Enter fullscreen mode Exit fullscreen mode

一部のソースでは以下が記載されています。

https://open.z.ai/api/paas/v4
Enter fullscreen mode Exit fullscreen mode

認証エラーや404が出る場合は、もう一方を試し、Z.aiドキュメントで最新の値を確認してください。

ClineとCursorでは、次の一般APIベースURLを使います。

https://api.z.ai/api/paas/v4/
Enter fullscreen mode Exit fullscreen mode

GLM-5.2は画像を扱えますか?

GLM-5.2にビジョン対応バリアントは確認されていません。テキスト入力・テキスト出力のコーディングおよび推論モデルとして扱ってください。Z.aiがリリースするまでは、「GLM-5.2V」のような画像対応版を前提にしないほうが安全です。

まとめ

GLM-5.2をClaude Code、Cline、Cursorで使う場合は、ハーネスごとにAPI形式とモデルIDを正しく分ける必要があります。

  • Claude Code:

    • https://api.z.ai/api/coding/paas/v4
    • glm-5.2[1m]
    • CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
    • API_TIMEOUT_MS=3000000
  • Cline:

    • https://api.z.ai/api/paas/v4/
    • glm-5.2
    • コンテキストウィンドウを1000000に設定
  • Cursor:

    • https://api.z.ai/api/paas/v4/
    • glm-5.2
    • カスタムモデルとして追加

ハーネスなしで試したい場合は、GLM-5.2を無料で使う方法GLM-5.2の料金内訳を参照してください。ローカルで使う場合は、Hugging Faceからウェイトを取得するか、Ollamaでモデルをプルできます。

Top comments (0)