DEV Community

Cover image for Cómo usar GLM-5.2 con Claude Code, Cline y Cursor
Roobia
Roobia

Posted on • Originally published at apidog.com

Cómo usar GLM-5.2 con Claude Code, Cline y Cursor

GLM-5.2 es el modelo de codificación de pesos abiertos de Z.ai. Puede usarse con Claude Code, Cline y Cursor, pero cada herramienta requiere una configuración distinta: Claude Code usa un endpoint compatible con Anthropic, mientras que Cline y Cursor usan un endpoint compatible con OpenAI. Esta guía muestra cómo configurar las tres herramientas usando el Plan de Codificación GLM.

Prueba Apidog hoy

Si quiere revisar primero el modelo y su API, consulte la descripción general de GLM-5.2 y la referencia de la API de GLM-5.2. Esta publicación se centra en la configuración práctica.

Requisitos previos

GLM-5.2 es un modelo de Mezcla de Expertos de aproximadamente 753B parámetros, con una ventana de contexto de 1M de tokens, exactamente 1.048.576 tokens. Está orientado a codificación, razonamiento y uso agentivo de herramientas.

Según los resultados publicados de Z.ai, el modelo alcanza 81.0 en Terminal-Bench 2.1, frente al 62.0 de GLM-5.1. VentureBeat lo describió como superior a GPT-5.5 en benchmarks de codificación de largo alcance por aproximadamente un sexto del costo.

GLM-5.2 benchmark

Antes de empezar, asegúrese de tener:

  • Una cuenta de Z.ai y una clave API.
  • Para Claude Code y flujos agentivos, una clave del Plan de Codificación GLM, no solo una clave de pago por uso.
  • Una de estas herramientas instalada:
    • Claude Code
    • Cline, como extensión de VS Code
    • Cursor
  • El ID del modelo:
    • glm-5.2 para Cline y Cursor
    • glm-5.2[1m] para Claude Code

Nota sobre costos: la API estándar cuesta $1.40 por 1M de tokens de entrada y $4.40 por 1M de tokens de salida, según OpenRouter. La entrada en caché se ha citado alrededor de $0.26 por 1M de tokens, atribuido a VentureBeat. El Plan de Codificación GLM usa una suscripción separada con niveles Lite, Pro, Max y Team. Verifique siempre los precios actuales en z.ai, ya que pueden cambiar.

Configurar GLM-5.2 en Claude Code

Claude Code se conecta mediante un endpoint compatible con Anthropic. Z.ai expone un endpoint específico para herramientas de codificación.

Configurar GLM-5.2 en Claude Code

Configure las siguientes variables de entorno en su shell.

Si usa zsh:

nano ~/.zshrc
Enter fullscreen mode Exit fullscreen mode

Si usa bash:

nano ~/.bashrc
Enter fullscreen mode Exit fullscreen mode

Agregue:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Enter fullscreen mode Exit fullscreen mode

Recargue el perfil:

source ~/.zshrc
# o
source ~/.bashrc
Enter fullscreen mode Exit fullscreen mode

Inicie Claude Code:

claude
Enter fullscreen mode Exit fullscreen mode

Variables importantes para Claude Code

ANTHROPIC_BASE_URL

Use:

https://api.z.ai/api/coding/paas/v4
Enter fullscreen mode Exit fullscreen mode

Este es el endpoint de codificación compatible con Anthropic.

Algunas guías antiguas muestran:

https://open.z.ai/api/paas/v4
Enter fullscreen mode Exit fullscreen mode

Si recibe errores 404 o de autenticación, pruebe el otro host y confirme el valor actual en la documentación de GLM-5.2 de Z.ai.

glm-5.2[1m]

Claude Code usa el sufijo [1m] para seleccionar la variante de contexto de 1M tokens.

Configure tanto Sonnet como Opus hacia el mismo modelo:

export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
Enter fullscreen mode Exit fullscreen mode

Así, cualquier nivel de modelo que Claude Code intente usar terminará resolviendo a GLM-5.2.

CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000

Claude Code compacta automáticamente la conversación cuando se acerca al límite de contexto. Si deja el valor predeterminado, puede desperdiciar buena parte de la ventana de GLM-5.2.

Use:

export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
Enter fullscreen mode Exit fullscreen mode

Esto permite que Claude Code mantenga más código, diffs, pruebas y contexto del repositorio antes de resumir.

API_TIMEOUT_MS=3000000

Para tareas largas, esta variable es crítica:

export API_TIMEOUT_MS=3000000
Enter fullscreen mode Exit fullscreen mode

Equivale a 3.000 segundos, o 50 minutos. En tareas agentivas con contexto grande, el modelo puede tardar bastante antes de emitir el primer token. Sin este ajuste, Claude Code puede cortar la solicitud antes de que el modelo responda.

Esfuerzo de razonamiento

GLM-5.2 tiene dos niveles de razonamiento: Alto y Máximo. Z.ai recomienda Máximo para codificación.

Si la herramienta permite pasar reasoning_effort, use:

{
  "reasoning_effort": "max"
}
Enter fullscreen mode Exit fullscreen mode

Para respuestas rápidas o más económicas, el pensamiento también puede desactivarse cuando no necesite razonamiento profundo.

Si viene de una versión anterior, el patrón es el mismo que en GLM-5.1 en Claude Code y GLM-4.5 con Claude Code: cambie el ID del modelo y la URL base, pero mantenga la estructura.

Configurar GLM-5.2 en Cline

Cline es una extensión de VS Code que ejecuta un agente de codificación dentro del editor. A diferencia de Claude Code, Cline usa un endpoint compatible con OpenAI.

Configurar GLM-5.2 en Cline

Siga estos pasos:

  1. Instale Cline desde el marketplace de VS Code.
  2. Abra el panel de Cline.
  3. Haga clic en el icono de engranaje para abrir la configuración.
  4. En Proveedor de API, seleccione Compatible con OpenAI.
  5. En URL base, use:
   https://api.z.ai/api/paas/v4/
Enter fullscreen mode Exit fullscreen mode
  1. Pegue su clave API de Z.ai.
  2. En ID del modelo, escriba:
   glm-5.2
Enter fullscreen mode Exit fullscreen mode
  1. Configure la ventana de contexto en:
   1000000
Enter fullscreen mode Exit fullscreen mode
  1. Guarde la configuración.
  2. Inicie una tarea en Cline.

Configuración mínima:

Proveedor: Compatible con OpenAI
URL base: https://api.z.ai/api/paas/v4/
Modelo: glm-5.2
Ventana de contexto: 1000000
Enter fullscreen mode Exit fullscreen mode

La ventana de contexto es especialmente importante en Cline. Como Cline puede ejecutar muchas llamadas a herramientas por tarea, una ventana demasiado pequeña hace que pierda pasos anteriores, resultados de pruebas o cambios previos. Con 1000000, puede mantener más historial dentro del alcance del modelo.

Configurar GLM-5.2 en Cursor

Cursor también usa un endpoint compatible con OpenAI, por lo que la configuración es similar a Cline.

Configurar GLM-5.2 en Cursor

Pasos:

  1. Abra la configuración de Cursor.
  2. Vaya a Modelos.
  3. Busque la sección de claves API de OpenAI.
  4. Active la URL base personalizada o la opción equivalente, como “Anular URL base de OpenAI”.
  5. Configure la URL base:
   https://api.z.ai/api/paas/v4/
Enter fullscreen mode Exit fullscreen mode
  1. Ingrese su clave API de Z.ai.
  2. Agregue un modelo personalizado con este ID:
   glm-5.2
Enter fullscreen mode Exit fullscreen mode
  1. Seleccione glm-5.2 como modelo activo.
  2. Use la prueba de conexión integrada de Cursor.
  3. Envíe una consulta de prueba.

Ejemplo de prompt para validar la integración:

Lee este archivo y sugiere una refactorización segura sin cambiar el comportamiento público.
Enter fullscreen mode Exit fullscreen mode

Una vez verificada la conexión, GLM-5.2 puede usarse para chat, ediciones en línea y asistencia de código dentro de Cursor.

Si ya ha usado Cursor con otros modelos GLM, las diferencias descritas en Claude Code vs Cursor con GLM-4.7 siguen aplicando: Cursor es más cómodo para ediciones rápidas en línea, mientras que Claude Code y Cline encajan mejor con tareas agentivas de varios pasos.

Comparación rápida de configuración

Use esta tabla para copiar los valores correctos según la herramienta.

Configuración Claude Code Cline Cursor
Formato de API Compatible con Anthropic Compatible con OpenAI Compatible con OpenAI
URL base https://api.z.ai/api/coding/paas/v4 https://api.z.ai/api/paas/v4/ https://api.z.ai/api/paas/v4/
ID del modelo glm-5.2[1m] glm-5.2 glm-5.2
Tipo de clave Clave del Plan de Codificación GLM Clave API Clave API
Ventana de contexto CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 1000000 Predeterminado del modelo
Tiempo de espera API_TIMEOUT_MS=3000000 n/d n/d
Esfuerzo de pensamiento Máximo recomendado para codificación Predeterminado del proveedor Predeterminado del proveedor

Los errores más comunes son:

  • Usar la URL base general en Claude Code.
  • Usar el endpoint de codificación en Cline o Cursor.
  • Olvidar el sufijo glm-5.2[1m] en Claude Code.
  • No aumentar API_TIMEOUT_MS para tareas largas.
  • Dejar la ventana de contexto de Cline en un valor demasiado bajo.

Probar la API antes de configurar la herramienta

Antes de depurar Claude Code, Cline o Cursor, valide que la clave y el modelo funcionan con una llamada directa.

Configure su clave:

export ZAI_API_KEY="your-zai-api-key"
Enter fullscreen mode Exit fullscreen mode

Ejecute:

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {
        "role": "user",
        "content": "Escribe una función en Python que invierta una lista enlazada."
      }
    ],
    "thinking": {
      "type": "enabled"
    },
    "reasoning_effort": "max",
    "stream": false
  }'
Enter fullscreen mode Exit fullscreen mode

Si recibe una finalización, la clave y el modelo funcionan. Cualquier problema restante estará en la configuración de la herramienta.

También puede guardar esta solicitud en un cliente API. Si está probando GLM-5.2 junto con sus propios endpoints de backend, Apidog permite guardar la solicitud, administrar encabezados como Authorization o ANTHROPIC_API_KEY mediante variables de entorno y reutilizar el flujo sin reescribir el curl. Puede descargar Apidog e importar el curl anterior directamente.

Qué herramienta debería usar

No hay una única mejor opción. Depende del flujo de trabajo.

Use Claude Code si necesita automatización desde terminal

Claude Code es una buena opción para:

  • Refactorizaciones grandes.
  • Cambios en múltiples archivos.
  • Tareas agentivas de largo alcance.
  • Uso explícito del contexto de 1M mediante glm-5.2[1m].

Configuración recomendada:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Enter fullscreen mode Exit fullscreen mode

Use Cline si trabaja principalmente en VS Code

Cline encaja bien si quiere:

  • Mantener el agente dentro de VS Code.
  • Revisar cada llamada a herramienta.
  • Aprobar cambios paso a paso.
  • Ejecutar comandos, editar archivos y ver el plan dentro del editor.

Configuración recomendada:

Proveedor: Compatible con OpenAI
URL base: https://api.z.ai/api/paas/v4/
Modelo: glm-5.2
Ventana de contexto: 1000000
Enter fullscreen mode Exit fullscreen mode

Use Cursor si quiere ediciones rápidas en el editor

Cursor es práctico para:

  • Ediciones en línea.
  • Autocompletado asistido.
  • Chat sobre archivos abiertos.
  • Cambios pequeños o medianos con baja fricción.

Configuración recomendada:

URL base personalizada: https://api.z.ai/api/paas/v4/
Modelo personalizado: glm-5.2
Enter fullscreen mode Exit fullscreen mode

Para una comparación más amplia entre planes y herramientas, consulte Claude Code vs Codex vs Cursor vs MiniMax vs Plan GLM.

También puede revisar:

Preguntas frecuentes

¿Por qué uso glm-5.2[1m] en Claude Code pero glm-5.2 en Cline y Cursor?

Porque glm-5.2[1m] es una convención usada por Claude Code para seleccionar la variante de contexto de 1M a través del endpoint de codificación.

Cline y Cursor envían el ID simple:

glm-5.2
Enter fullscreen mode Exit fullscreen mode

En esas herramientas, la ventana de contexto se configura desde la interfaz o queda gestionada por el proveedor.

¿Qué hago si Claude Code se agota el tiempo en tareas largas?

Aumente el timeout:

export API_TIMEOUT_MS=3000000
Enter fullscreen mode Exit fullscreen mode

Sin este valor, Claude Code puede abortar solicitudes largas antes de que GLM-5.2 empiece a responder.

¿Necesito el Plan de Codificación GLM o puedo usar pago por uso?

Ambos pueden funcionar, pero para Claude Code el endpoint de codificación espera una clave del Plan de Codificación GLM. Además, para uso diario intensivo, los niveles mensuales pueden ser más convenientes que la facturación por token.

Verifique los precios actuales en z.ai, porque las cifras publicadas pueden cambiar.

¿Cuál es la URL base correcta para Claude Code?

Use:

https://api.z.ai/api/coding/paas/v4
Enter fullscreen mode Exit fullscreen mode

Algunas fuentes muestran:

https://open.z.ai/api/paas/v4
Enter fullscreen mode Exit fullscreen mode

Si una falla con 404 o errores de autenticación, pruebe la otra y consulte la documentación de Z.ai.

Para Cline y Cursor, use la base general:

https://api.z.ai/api/paas/v4/
Enter fullscreen mode Exit fullscreen mode

¿GLM-5.2 puede manejar imágenes?

No hay una variante de visión confirmada para GLM-5.2. Es un modelo de codificación y razonamiento texto a texto. No espere soporte de imágenes hasta que Z.ai publique una variante específica.

Cierre

GLM-5.2 puede integrarse con Claude Code, Cline y Cursor, pero debe usar el endpoint correcto para cada herramienta.

Resumen operativo:

Claude Code -> Anthropic-compatible -> https://api.z.ai/api/coding/paas/v4 -> glm-5.2[1m]
Cline       -> OpenAI-compatible    -> https://api.z.ai/api/paas/v4/        -> glm-5.2
Cursor      -> OpenAI-compatible    -> https://api.z.ai/api/paas/v4/        -> glm-5.2
Enter fullscreen mode Exit fullscreen mode

Para Claude Code, no olvide:

export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Enter fullscreen mode Exit fullscreen mode

Para Cline, configure la ventana de contexto en:

1000000
Enter fullscreen mode Exit fullscreen mode

Si quiere usar GLM-5.2 sin estas herramientas, consulte cómo usar GLM-5.2 de forma gratuita y el desglose de precios de GLM-5.2. También puede obtener los pesos desde Hugging Face o ejecutar el modelo localmente con Ollama.

Top comments (0)