GLM-5.2 es el modelo de codificación de pesos abiertos de Z.ai. Puede usarse con Claude Code, Cline y Cursor, pero cada herramienta requiere una configuración distinta: Claude Code usa un endpoint compatible con Anthropic, mientras que Cline y Cursor usan un endpoint compatible con OpenAI. Esta guía muestra cómo configurar las tres herramientas usando el Plan de Codificación GLM.
Si quiere revisar primero el modelo y su API, consulte la descripción general de GLM-5.2 y la referencia de la API de GLM-5.2. Esta publicación se centra en la configuración práctica.
Requisitos previos
GLM-5.2 es un modelo de Mezcla de Expertos de aproximadamente 753B parámetros, con una ventana de contexto de 1M de tokens, exactamente 1.048.576 tokens. Está orientado a codificación, razonamiento y uso agentivo de herramientas.
Según los resultados publicados de Z.ai, el modelo alcanza 81.0 en Terminal-Bench 2.1, frente al 62.0 de GLM-5.1. VentureBeat lo describió como superior a GPT-5.5 en benchmarks de codificación de largo alcance por aproximadamente un sexto del costo.
Antes de empezar, asegúrese de tener:
- Una cuenta de Z.ai y una clave API.
- Para Claude Code y flujos agentivos, una clave del Plan de Codificación GLM, no solo una clave de pago por uso.
- Una de estas herramientas instalada:
- Claude Code
- Cline, como extensión de VS Code
- Cursor
- El ID del modelo:
-
glm-5.2para Cline y Cursor -
glm-5.2[1m]para Claude Code
-
Nota sobre costos: la API estándar cuesta $1.40 por 1M de tokens de entrada y $4.40 por 1M de tokens de salida, según OpenRouter. La entrada en caché se ha citado alrededor de $0.26 por 1M de tokens, atribuido a VentureBeat. El Plan de Codificación GLM usa una suscripción separada con niveles Lite, Pro, Max y Team. Verifique siempre los precios actuales en z.ai, ya que pueden cambiar.
Configurar GLM-5.2 en Claude Code
Claude Code se conecta mediante un endpoint compatible con Anthropic. Z.ai expone un endpoint específico para herramientas de codificación.
Configure las siguientes variables de entorno en su shell.
Si usa zsh:
nano ~/.zshrc
Si usa bash:
nano ~/.bashrc
Agregue:
export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Recargue el perfil:
source ~/.zshrc
# o
source ~/.bashrc
Inicie Claude Code:
claude
Variables importantes para Claude Code
ANTHROPIC_BASE_URL
Use:
https://api.z.ai/api/coding/paas/v4
Este es el endpoint de codificación compatible con Anthropic.
Algunas guías antiguas muestran:
https://open.z.ai/api/paas/v4
Si recibe errores 404 o de autenticación, pruebe el otro host y confirme el valor actual en la documentación de GLM-5.2 de Z.ai.
glm-5.2[1m]
Claude Code usa el sufijo [1m] para seleccionar la variante de contexto de 1M tokens.
Configure tanto Sonnet como Opus hacia el mismo modelo:
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
Así, cualquier nivel de modelo que Claude Code intente usar terminará resolviendo a GLM-5.2.
CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
Claude Code compacta automáticamente la conversación cuando se acerca al límite de contexto. Si deja el valor predeterminado, puede desperdiciar buena parte de la ventana de GLM-5.2.
Use:
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
Esto permite que Claude Code mantenga más código, diffs, pruebas y contexto del repositorio antes de resumir.
API_TIMEOUT_MS=3000000
Para tareas largas, esta variable es crítica:
export API_TIMEOUT_MS=3000000
Equivale a 3.000 segundos, o 50 minutos. En tareas agentivas con contexto grande, el modelo puede tardar bastante antes de emitir el primer token. Sin este ajuste, Claude Code puede cortar la solicitud antes de que el modelo responda.
Esfuerzo de razonamiento
GLM-5.2 tiene dos niveles de razonamiento: Alto y Máximo. Z.ai recomienda Máximo para codificación.
Si la herramienta permite pasar reasoning_effort, use:
{
"reasoning_effort": "max"
}
Para respuestas rápidas o más económicas, el pensamiento también puede desactivarse cuando no necesite razonamiento profundo.
Si viene de una versión anterior, el patrón es el mismo que en GLM-5.1 en Claude Code y GLM-4.5 con Claude Code: cambie el ID del modelo y la URL base, pero mantenga la estructura.
Configurar GLM-5.2 en Cline
Cline es una extensión de VS Code que ejecuta un agente de codificación dentro del editor. A diferencia de Claude Code, Cline usa un endpoint compatible con OpenAI.
Siga estos pasos:
- Instale Cline desde el marketplace de VS Code.
- Abra el panel de Cline.
- Haga clic en el icono de engranaje para abrir la configuración.
- En Proveedor de API, seleccione Compatible con OpenAI.
- En URL base, use:
https://api.z.ai/api/paas/v4/
- Pegue su clave API de Z.ai.
- En ID del modelo, escriba:
glm-5.2
- Configure la ventana de contexto en:
1000000
- Guarde la configuración.
- Inicie una tarea en Cline.
Configuración mínima:
Proveedor: Compatible con OpenAI
URL base: https://api.z.ai/api/paas/v4/
Modelo: glm-5.2
Ventana de contexto: 1000000
La ventana de contexto es especialmente importante en Cline. Como Cline puede ejecutar muchas llamadas a herramientas por tarea, una ventana demasiado pequeña hace que pierda pasos anteriores, resultados de pruebas o cambios previos. Con 1000000, puede mantener más historial dentro del alcance del modelo.
Configurar GLM-5.2 en Cursor
Cursor también usa un endpoint compatible con OpenAI, por lo que la configuración es similar a Cline.
Pasos:
- Abra la configuración de Cursor.
- Vaya a Modelos.
- Busque la sección de claves API de OpenAI.
- Active la URL base personalizada o la opción equivalente, como “Anular URL base de OpenAI”.
- Configure la URL base:
https://api.z.ai/api/paas/v4/
- Ingrese su clave API de Z.ai.
- Agregue un modelo personalizado con este ID:
glm-5.2
- Seleccione
glm-5.2como modelo activo. - Use la prueba de conexión integrada de Cursor.
- Envíe una consulta de prueba.
Ejemplo de prompt para validar la integración:
Lee este archivo y sugiere una refactorización segura sin cambiar el comportamiento público.
Una vez verificada la conexión, GLM-5.2 puede usarse para chat, ediciones en línea y asistencia de código dentro de Cursor.
Si ya ha usado Cursor con otros modelos GLM, las diferencias descritas en Claude Code vs Cursor con GLM-4.7 siguen aplicando: Cursor es más cómodo para ediciones rápidas en línea, mientras que Claude Code y Cline encajan mejor con tareas agentivas de varios pasos.
Comparación rápida de configuración
Use esta tabla para copiar los valores correctos según la herramienta.
| Configuración | Claude Code | Cline | Cursor |
|---|---|---|---|
| Formato de API | Compatible con Anthropic | Compatible con OpenAI | Compatible con OpenAI |
| URL base | https://api.z.ai/api/coding/paas/v4 |
https://api.z.ai/api/paas/v4/ |
https://api.z.ai/api/paas/v4/ |
| ID del modelo | glm-5.2[1m] |
glm-5.2 |
glm-5.2 |
| Tipo de clave | Clave del Plan de Codificación GLM | Clave API | Clave API |
| Ventana de contexto | CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 |
1000000 |
Predeterminado del modelo |
| Tiempo de espera | API_TIMEOUT_MS=3000000 |
n/d | n/d |
| Esfuerzo de pensamiento | Máximo recomendado para codificación | Predeterminado del proveedor | Predeterminado del proveedor |
Los errores más comunes son:
- Usar la URL base general en Claude Code.
- Usar el endpoint de codificación en Cline o Cursor.
- Olvidar el sufijo
glm-5.2[1m]en Claude Code. - No aumentar
API_TIMEOUT_MSpara tareas largas. - Dejar la ventana de contexto de Cline en un valor demasiado bajo.
Probar la API antes de configurar la herramienta
Antes de depurar Claude Code, Cline o Cursor, valide que la clave y el modelo funcionan con una llamada directa.
Configure su clave:
export ZAI_API_KEY="your-zai-api-key"
Ejecute:
curl https://api.z.ai/api/paas/v4/chat/completions \
-H "Authorization: Bearer $ZAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.2",
"messages": [
{
"role": "user",
"content": "Escribe una función en Python que invierta una lista enlazada."
}
],
"thinking": {
"type": "enabled"
},
"reasoning_effort": "max",
"stream": false
}'
Si recibe una finalización, la clave y el modelo funcionan. Cualquier problema restante estará en la configuración de la herramienta.
También puede guardar esta solicitud en un cliente API. Si está probando GLM-5.2 junto con sus propios endpoints de backend, Apidog permite guardar la solicitud, administrar encabezados como Authorization o ANTHROPIC_API_KEY mediante variables de entorno y reutilizar el flujo sin reescribir el curl. Puede descargar Apidog e importar el curl anterior directamente.
Qué herramienta debería usar
No hay una única mejor opción. Depende del flujo de trabajo.
Use Claude Code si necesita automatización desde terminal
Claude Code es una buena opción para:
- Refactorizaciones grandes.
- Cambios en múltiples archivos.
- Tareas agentivas de largo alcance.
- Uso explícito del contexto de 1M mediante
glm-5.2[1m].
Configuración recomendada:
export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Use Cline si trabaja principalmente en VS Code
Cline encaja bien si quiere:
- Mantener el agente dentro de VS Code.
- Revisar cada llamada a herramienta.
- Aprobar cambios paso a paso.
- Ejecutar comandos, editar archivos y ver el plan dentro del editor.
Configuración recomendada:
Proveedor: Compatible con OpenAI
URL base: https://api.z.ai/api/paas/v4/
Modelo: glm-5.2
Ventana de contexto: 1000000
Use Cursor si quiere ediciones rápidas en el editor
Cursor es práctico para:
- Ediciones en línea.
- Autocompletado asistido.
- Chat sobre archivos abiertos.
- Cambios pequeños o medianos con baja fricción.
Configuración recomendada:
URL base personalizada: https://api.z.ai/api/paas/v4/
Modelo personalizado: glm-5.2
Para una comparación más amplia entre planes y herramientas, consulte Claude Code vs Codex vs Cursor vs MiniMax vs Plan GLM.
También puede revisar:
Preguntas frecuentes
¿Por qué uso glm-5.2[1m] en Claude Code pero glm-5.2 en Cline y Cursor?
Porque glm-5.2[1m] es una convención usada por Claude Code para seleccionar la variante de contexto de 1M a través del endpoint de codificación.
Cline y Cursor envían el ID simple:
glm-5.2
En esas herramientas, la ventana de contexto se configura desde la interfaz o queda gestionada por el proveedor.
¿Qué hago si Claude Code se agota el tiempo en tareas largas?
Aumente el timeout:
export API_TIMEOUT_MS=3000000
Sin este valor, Claude Code puede abortar solicitudes largas antes de que GLM-5.2 empiece a responder.
¿Necesito el Plan de Codificación GLM o puedo usar pago por uso?
Ambos pueden funcionar, pero para Claude Code el endpoint de codificación espera una clave del Plan de Codificación GLM. Además, para uso diario intensivo, los niveles mensuales pueden ser más convenientes que la facturación por token.
Verifique los precios actuales en z.ai, porque las cifras publicadas pueden cambiar.
¿Cuál es la URL base correcta para Claude Code?
Use:
https://api.z.ai/api/coding/paas/v4
Algunas fuentes muestran:
https://open.z.ai/api/paas/v4
Si una falla con 404 o errores de autenticación, pruebe la otra y consulte la documentación de Z.ai.
Para Cline y Cursor, use la base general:
https://api.z.ai/api/paas/v4/
¿GLM-5.2 puede manejar imágenes?
No hay una variante de visión confirmada para GLM-5.2. Es un modelo de codificación y razonamiento texto a texto. No espere soporte de imágenes hasta que Z.ai publique una variante específica.
Cierre
GLM-5.2 puede integrarse con Claude Code, Cline y Cursor, pero debe usar el endpoint correcto para cada herramienta.
Resumen operativo:
Claude Code -> Anthropic-compatible -> https://api.z.ai/api/coding/paas/v4 -> glm-5.2[1m]
Cline -> OpenAI-compatible -> https://api.z.ai/api/paas/v4/ -> glm-5.2
Cursor -> OpenAI-compatible -> https://api.z.ai/api/paas/v4/ -> glm-5.2
Para Claude Code, no olvide:
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Para Cline, configure la ventana de contexto en:
1000000
Si quiere usar GLM-5.2 sin estas herramientas, consulte cómo usar GLM-5.2 de forma gratuita y el desglose de precios de GLM-5.2. También puede obtener los pesos desde Hugging Face o ejecutar el modelo localmente con Ollama.



Top comments (0)