Roobia

Posted on Jun 17 • Originally published at apidog.com

Cómo usar GLM-5.2 con Claude Code, Cline y Cursor

GLM-5.2 es el modelo de codificación de pesos abiertos de Z.ai. Puede usarse con Claude Code, Cline y Cursor, pero cada herramienta requiere una configuración distinta: Claude Code usa un endpoint compatible con Anthropic, mientras que Cline y Cursor usan un endpoint compatible con OpenAI. Esta guía muestra cómo configurar las tres herramientas usando el Plan de Codificación GLM.

Prueba Apidog hoy

Si quiere revisar primero el modelo y su API, consulte la descripción general de GLM-5.2 y la referencia de la API de GLM-5.2. Esta publicación se centra en la configuración práctica.

Requisitos previos

GLM-5.2 es un modelo de Mezcla de Expertos de aproximadamente 753B parámetros, con una ventana de contexto de 1M de tokens, exactamente 1.048.576 tokens. Está orientado a codificación, razonamiento y uso agentivo de herramientas.

Según los resultados publicados de Z.ai, el modelo alcanza 81.0 en Terminal-Bench 2.1, frente al 62.0 de GLM-5.1. VentureBeat lo describió como superior a GPT-5.5 en benchmarks de codificación de largo alcance por aproximadamente un sexto del costo.

Antes de empezar, asegúrese de tener:

Una cuenta de Z.ai y una clave API.
Para Claude Code y flujos agentivos, una clave del Plan de Codificación GLM, no solo una clave de pago por uso.
Una de estas herramientas instalada:
- Claude Code
- Cline, como extensión de VS Code
- Cursor
El ID del modelo:
- glm-5.2 para Cline y Cursor
- glm-5.2[1m] para Claude Code

Nota sobre costos: la API estándar cuesta $1.40 por 1M de tokens de entrada y $4.40 por 1M de tokens de salida, según OpenRouter. La entrada en caché se ha citado alrededor de $0.26 por 1M de tokens, atribuido a VentureBeat. El Plan de Codificación GLM usa una suscripción separada con niveles Lite, Pro, Max y Team. Verifique siempre los precios actuales en z.ai, ya que pueden cambiar.

Configurar GLM-5.2 en Claude Code

Claude Code se conecta mediante un endpoint compatible con Anthropic. Z.ai expone un endpoint específico para herramientas de codificación.

Configure las siguientes variables de entorno en su shell.

Si usa zsh:

nano ~/.zshrc

Si usa bash:

nano ~/.bashrc

Agregue:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

Recargue el perfil:

source ~/.zshrc
# o
source ~/.bashrc

Inicie Claude Code:

claude

Variables importantes para Claude Code

`ANTHROPIC_BASE_URL`

Use:

https://api.z.ai/api/coding/paas/v4

Este es el endpoint de codificación compatible con Anthropic.

Algunas guías antiguas muestran:

https://open.z.ai/api/paas/v4

Si recibe errores 404 o de autenticación, pruebe el otro host y confirme el valor actual en la documentación de GLM-5.2 de Z.ai.

`glm-5.2[1m]`

Claude Code usa el sufijo [1m] para seleccionar la variante de contexto de 1M tokens.

Configure tanto Sonnet como Opus hacia el mismo modelo:

export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"

Así, cualquier nivel de modelo que Claude Code intente usar terminará resolviendo a GLM-5.2.

`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`

Claude Code compacta automáticamente la conversación cuando se acerca al límite de contexto. Si deja el valor predeterminado, puede desperdiciar buena parte de la ventana de GLM-5.2.

Use:

export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000

Esto permite que Claude Code mantenga más código, diffs, pruebas y contexto del repositorio antes de resumir.

`API_TIMEOUT_MS=3000000`

Para tareas largas, esta variable es crítica:

export API_TIMEOUT_MS=3000000

Equivale a 3.000 segundos, o 50 minutos. En tareas agentivas con contexto grande, el modelo puede tardar bastante antes de emitir el primer token. Sin este ajuste, Claude Code puede cortar la solicitud antes de que el modelo responda.

Esfuerzo de razonamiento

GLM-5.2 tiene dos niveles de razonamiento: Alto y Máximo. Z.ai recomienda Máximo para codificación.

Si la herramienta permite pasar reasoning_effort, use:

{
  "reasoning_effort": "max"
}

Para respuestas rápidas o más económicas, el pensamiento también puede desactivarse cuando no necesite razonamiento profundo.

Si viene de una versión anterior, el patrón es el mismo que en GLM-5.1 en Claude Code y GLM-4.5 con Claude Code: cambie el ID del modelo y la URL base, pero mantenga la estructura.

Configurar GLM-5.2 en Cline

Cline es una extensión de VS Code que ejecuta un agente de codificación dentro del editor. A diferencia de Claude Code, Cline usa un endpoint compatible con OpenAI.

Siga estos pasos:

Instale Cline desde el marketplace de VS Code.
Abra el panel de Cline.
Haga clic en el icono de engranaje para abrir la configuración.
En Proveedor de API, seleccione Compatible con OpenAI.
En URL base, use:

   https://api.z.ai/api/paas/v4/

Pegue su clave API de Z.ai.
En ID del modelo, escriba:

   glm-5.2

Configure la ventana de contexto en:

Guarde la configuración.
Inicie una tarea en Cline.

Configuración mínima:

Proveedor: Compatible con OpenAI
URL base: https://api.z.ai/api/paas/v4/
Modelo: glm-5.2
Ventana de contexto: 1000000

La ventana de contexto es especialmente importante en Cline. Como Cline puede ejecutar muchas llamadas a herramientas por tarea, una ventana demasiado pequeña hace que pierda pasos anteriores, resultados de pruebas o cambios previos. Con 1000000, puede mantener más historial dentro del alcance del modelo.

Configurar GLM-5.2 en Cursor

Cursor también usa un endpoint compatible con OpenAI, por lo que la configuración es similar a Cline.

Pasos:

Abra la configuración de Cursor.
Vaya a Modelos.
Busque la sección de claves API de OpenAI.
Active la URL base personalizada o la opción equivalente, como “Anular URL base de OpenAI”.
Configure la URL base:

   https://api.z.ai/api/paas/v4/

Ingrese su clave API de Z.ai.
Agregue un modelo personalizado con este ID:

   glm-5.2

Seleccione glm-5.2 como modelo activo.
Use la prueba de conexión integrada de Cursor.
Envíe una consulta de prueba.

Ejemplo de prompt para validar la integración:

Lee este archivo y sugiere una refactorización segura sin cambiar el comportamiento público.

Una vez verificada la conexión, GLM-5.2 puede usarse para chat, ediciones en línea y asistencia de código dentro de Cursor.

Si ya ha usado Cursor con otros modelos GLM, las diferencias descritas en Claude Code vs Cursor con GLM-4.7 siguen aplicando: Cursor es más cómodo para ediciones rápidas en línea, mientras que Claude Code y Cline encajan mejor con tareas agentivas de varios pasos.

Comparación rápida de configuración

Use esta tabla para copiar los valores correctos según la herramienta.

Configuración	Claude Code	Cline	Cursor
Formato de API	Compatible con Anthropic	Compatible con OpenAI	Compatible con OpenAI
URL base	`https://api.z.ai/api/coding/paas/v4`	`https://api.z.ai/api/paas/v4/`	`https://api.z.ai/api/paas/v4/`
ID del modelo	`glm-5.2[1m]`	`glm-5.2`	`glm-5.2`
Tipo de clave	Clave del Plan de Codificación GLM	Clave API	Clave API
Ventana de contexto	`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`	`1000000`	Predeterminado del modelo
Tiempo de espera	`API_TIMEOUT_MS=3000000`	n/d	n/d
Esfuerzo de pensamiento	Máximo recomendado para codificación	Predeterminado del proveedor	Predeterminado del proveedor

Los errores más comunes son:

Usar la URL base general en Claude Code.
Usar el endpoint de codificación en Cline o Cursor.
Olvidar el sufijo glm-5.2[1m] en Claude Code.
No aumentar API_TIMEOUT_MS para tareas largas.
Dejar la ventana de contexto de Cline en un valor demasiado bajo.

Probar la API antes de configurar la herramienta

Antes de depurar Claude Code, Cline o Cursor, valide que la clave y el modelo funcionan con una llamada directa.

Configure su clave:

export ZAI_API_KEY="your-zai-api-key"

Ejecute:

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {
        "role": "user",
        "content": "Escribe una función en Python que invierta una lista enlazada."
      }
    ],
    "thinking": {
      "type": "enabled"
    },
    "reasoning_effort": "max",
    "stream": false
  }'

Si recibe una finalización, la clave y el modelo funcionan. Cualquier problema restante estará en la configuración de la herramienta.

También puede guardar esta solicitud en un cliente API. Si está probando GLM-5.2 junto con sus propios endpoints de backend, Apidog permite guardar la solicitud, administrar encabezados como Authorization o ANTHROPIC_API_KEY mediante variables de entorno y reutilizar el flujo sin reescribir el curl. Puede descargar Apidog e importar el curl anterior directamente.

Qué herramienta debería usar

No hay una única mejor opción. Depende del flujo de trabajo.

Use Claude Code si necesita automatización desde terminal

Claude Code es una buena opción para:

Refactorizaciones grandes.
Cambios en múltiples archivos.
Tareas agentivas de largo alcance.
Uso explícito del contexto de 1M mediante glm-5.2[1m].

Configuración recomendada:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

Use Cline si trabaja principalmente en VS Code

Cline encaja bien si quiere:

Mantener el agente dentro de VS Code.
Revisar cada llamada a herramienta.
Aprobar cambios paso a paso.
Ejecutar comandos, editar archivos y ver el plan dentro del editor.

Configuración recomendada:

Proveedor: Compatible con OpenAI
URL base: https://api.z.ai/api/paas/v4/
Modelo: glm-5.2
Ventana de contexto: 1000000

Use Cursor si quiere ediciones rápidas en el editor

Cursor es práctico para:

Ediciones en línea.
Autocompletado asistido.
Chat sobre archivos abiertos.
Cambios pequeños o medianos con baja fricción.

Configuración recomendada:

URL base personalizada: https://api.z.ai/api/paas/v4/
Modelo personalizado: glm-5.2

Para una comparación más amplia entre planes y herramientas, consulte Claude Code vs Codex vs Cursor vs MiniMax vs Plan GLM.

También puede revisar:

Preguntas frecuentes

¿Por qué uso `glm-5.2[1m]` en Claude Code pero `glm-5.2` en Cline y Cursor?

Porque glm-5.2[1m] es una convención usada por Claude Code para seleccionar la variante de contexto de 1M a través del endpoint de codificación.

Cline y Cursor envían el ID simple:

glm-5.2

En esas herramientas, la ventana de contexto se configura desde la interfaz o queda gestionada por el proveedor.

¿Qué hago si Claude Code se agota el tiempo en tareas largas?

Aumente el timeout:

export API_TIMEOUT_MS=3000000

Sin este valor, Claude Code puede abortar solicitudes largas antes de que GLM-5.2 empiece a responder.

¿Necesito el Plan de Codificación GLM o puedo usar pago por uso?

Ambos pueden funcionar, pero para Claude Code el endpoint de codificación espera una clave del Plan de Codificación GLM. Además, para uso diario intensivo, los niveles mensuales pueden ser más convenientes que la facturación por token.

Verifique los precios actuales en z.ai, porque las cifras publicadas pueden cambiar.

¿Cuál es la URL base correcta para Claude Code?

Use:

https://api.z.ai/api/coding/paas/v4

Algunas fuentes muestran:

https://open.z.ai/api/paas/v4

Si una falla con 404 o errores de autenticación, pruebe la otra y consulte la documentación de Z.ai.

Para Cline y Cursor, use la base general:

https://api.z.ai/api/paas/v4/

¿GLM-5.2 puede manejar imágenes?

No hay una variante de visión confirmada para GLM-5.2. Es un modelo de codificación y razonamiento texto a texto. No espere soporte de imágenes hasta que Z.ai publique una variante específica.

Cierre

GLM-5.2 puede integrarse con Claude Code, Cline y Cursor, pero debe usar el endpoint correcto para cada herramienta.

Resumen operativo:

Claude Code -> Anthropic-compatible -> https://api.z.ai/api/coding/paas/v4 -> glm-5.2[1m]
Cline       -> OpenAI-compatible    -> https://api.z.ai/api/paas/v4/        -> glm-5.2
Cursor      -> OpenAI-compatible    -> https://api.z.ai/api/paas/v4/        -> glm-5.2

Para Claude Code, no olvide:

export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

Para Cline, configure la ventana de contexto en:

Si quiere usar GLM-5.2 sin estas herramientas, consulte cómo usar GLM-5.2 de forma gratuita y el desglose de precios de GLM-5.2. También puede obtener los pesos desde Hugging Face o ejecutar el modelo localmente con Ollama.

DEV Community

Cómo usar GLM-5.2 con Claude Code, Cline y Cursor

Requisitos previos

Configurar GLM-5.2 en Claude Code

Variables importantes para Claude Code

`ANTHROPIC_BASE_URL`

`glm-5.2[1m]`

`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`

`API_TIMEOUT_MS=3000000`

Esfuerzo de razonamiento

Configurar GLM-5.2 en Cline

Configurar GLM-5.2 en Cursor

Comparación rápida de configuración

Probar la API antes de configurar la herramienta

Qué herramienta debería usar

Use Claude Code si necesita automatización desde terminal

Use Cline si trabaja principalmente en VS Code

Use Cursor si quiere ediciones rápidas en el editor

Preguntas frecuentes

¿Por qué uso `glm-5.2[1m]` en Claude Code pero `glm-5.2` en Cline y Cursor?

¿Qué hago si Claude Code se agota el tiempo en tareas largas?

¿Necesito el Plan de Codificación GLM o puedo usar pago por uso?

¿Cuál es la URL base correcta para Claude Code?

¿GLM-5.2 puede manejar imágenes?

Cierre

Top comments (0)

Requisitos previos

Configurar GLM-5.2 en Claude Code

Variables importantes para Claude Code

ANTHROPIC_BASE_URL

glm-5.2[1m]

CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000

API_TIMEOUT_MS=3000000

Esfuerzo de razonamiento

Configurar GLM-5.2 en Cline

Configurar GLM-5.2 en Cursor

Comparación rápida de configuración

Probar la API antes de configurar la herramienta

Qué herramienta debería usar

Use Claude Code si necesita automatización desde terminal

Use Cline si trabaja principalmente en VS Code

Use Cursor si quiere ediciones rápidas en el editor

Preguntas frecuentes

¿Por qué uso glm-5.2[1m] en Claude Code pero glm-5.2 en Cline y Cursor?

¿Qué hago si Claude Code se agota el tiempo en tareas largas?

¿Necesito el Plan de Codificación GLM o puedo usar pago por uso?

¿Cuál es la URL base correcta para Claude Code?

¿GLM-5.2 puede manejar imágenes?

Cierre

`ANTHROPIC_BASE_URL`

`glm-5.2[1m]`

`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`

`API_TIMEOUT_MS=3000000`

¿Por qué uso `glm-5.2[1m]` en Claude Code pero `glm-5.2` en Cline y Cursor?