O GLM-5.2 é o modelo de codificação de pesos abertos da Z.ai. Ele pode ser usado em três ferramentas comuns no fluxo de desenvolvimento: Claude Code, Cline e Cursor. A diferença principal está no formato do endpoint: o Claude Code usa uma API compatível com Anthropic, enquanto Cline e Cursor usam um endpoint compatível com OpenAI. Este guia mostra como configurar os três usando o Plano de Codificação GLM.
Se você quiser revisar os detalhes do modelo antes da configuração, veja a visão geral do GLM-5.2 e a referência da API do GLM-5.2. Aqui o foco é conectar o modelo às ferramentas de codificação.
O que você precisa antes de começar
O GLM-5.2 é um modelo Mixture-of-Experts com cerca de 753 bilhões de parâmetros e janela de contexto de 1 milhão de tokens, exatamente 1.048.576 tokens. Ele é voltado para codificação, raciocínio e uso de ferramentas agenticas. Segundo os resultados publicados pela Z.ai, o modelo alcança 81,0 no Terminal-Bench 2.1, acima dos 62,0 do GLM-5.1. A VentureBeat também descreveu o modelo como superando o GPT-5.5 em benchmarks de codificação de longo prazo por aproximadamente um sexto do custo.
Antes de configurar, tenha em mãos:
- Uma conta na Z.ai e uma chave de API.
- Para Claude Code e ferramentas agenticas, uma chave do Plano de Codificação GLM, não apenas uma chave de pagamento conforme o uso.
- Uma das ferramentas instaladas:
- Claude Code
- Cline, extensão do VS Code
- Cursor
- O ID do modelo:
-
glm-5.2para Cline e Cursor -
glm-5.2[1m]no Claude Code, para usar a variante de contexto de 1M
-
Sobre custos: a API padrão custa US$ 1,40 por 1M de tokens de entrada e US$ 4,40 por 1M de tokens de saída, conforme listado no OpenRouter. A entrada em cache fica em torno de US$ 0,26 por 1M, valor atribuído à VentureBeat. O Plano de Codificação GLM é uma assinatura separada com níveis Lite, Pro, Max e Team. Como os preços públicos podem mudar, confirme os valores atuais em z.ai antes de adotar em produção.
Configurar o GLM-5.2 no Claude Code
O Claude Code se conecta a um endpoint compatível com Anthropic. A Z.ai expõe um endpoint específico para ferramentas de codificação, e você o configura via variáveis de ambiente.
Adicione o bloco abaixo ao seu shell, por exemplo em ~/.zshrc ou ~/.bashrc, ou exporte as variáveis antes de iniciar o Claude Code:
export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="sua-chave-glm-coding-plan"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
Depois, inicie o Claude Code normalmente:
claude
O que cada variável faz
ANTHROPIC_BASE_URL
Use:
https://api.z.ai/api/coding/paas/v4
Esse é o endpoint de codificação compatível com Anthropic. Alguns materiais antigos usam:
https://open.z.ai/api/paas/v4
Se você receber erro 404 ou falha de autenticação, teste o outro host e confira a documentação GLM-5.2 da Z.ai.
glm-5.2[1m]
No Claude Code, o sufixo [1m] seleciona a variante com janela de contexto de 1 milhão de tokens. Definir Sonnet e Opus para o mesmo modelo garante que qualquer nível usado pelo Claude Code aponte para o GLM-5.2.
CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
O Claude Code compacta o histórico quando se aproxima do limite de contexto. Se você deixar o valor padrão, a ferramenta pode resumir cedo demais e desperdiçar a janela longa do GLM-5.2. Use 1000000 para aproveitar o contexto completo antes da compactação.
API_TIMEOUT_MS=3000000
Esse valor equivale a 3.000 segundos, ou 50 minutos. Para tarefas agenticas longas com contexto grande, o modelo pode demorar antes de retornar o primeiro token. Sem esse timeout maior, o Claude Code pode abortar a chamada e exibir um erro de conexão.
Raciocínio
O GLM-5.2 oferece níveis de raciocínio Alto e Máximo. A Z.ai recomenda Máximo para codificação. Se a ferramenta permitir enviar reasoning_effort, use:
{
"reasoning_effort": "max"
}
Para tarefas simples e rápidas, você pode desativar o raciocínio quando quiser reduzir latência e custo.
Se você já configurou versões anteriores, o fluxo é semelhante ao usado no GLM-5.1 no Claude Code e no GLM-4.5 com Claude Code: troque o ID do modelo e a URL base.
Configurar o GLM-5.2 no Cline
O Cline é uma extensão do VS Code que executa um agente de codificação dentro do editor. Diferente do Claude Code, ele usa um endpoint compatível com OpenAI.
Siga estes passos:
- Instale a extensão Cline no marketplace do VS Code.
- Abra as configurações do Cline pelo ícone de engrenagem.
- Em Provedor de API, selecione Compatível com OpenAI.
- Em URL Base, use:
https://api.z.ai/api/paas/v4/
- Cole sua chave de API da Z.ai.
- Em ID do Modelo, informe:
glm-5.2
- Na configuração de janela de contexto, defina:
1000000
No Cline, não use o sufixo [1m]. Esse sufixo é específico do Claude Code.
Essa configuração permite que o Cline planeje, edite arquivos e execute comandos usando o GLM-5.2. Como o Cline pode disparar várias chamadas de ferramenta por tarefa, definir a janela de contexto para 1 milhão ajuda a manter plano, diffs, logs e resultados de teste no histórico.
Configurar o GLM-5.2 no Cursor
O Cursor é um editor independente com recursos de IA integrados. Ele também usa um endpoint compatível com OpenAI, então a configuração é parecida com a do Cline.
Passo a passo:
- Abra as configurações do Cursor.
- Vá para Modelos.
- Role até a seção da chave de API OpenAI.
- Ative a opção de URL base personalizada ou Substituir URL base da OpenAI.
- Defina a URL base como:
https://api.z.ai/api/paas/v4/
- Insira sua chave de API da Z.ai.
- Adicione um modelo personalizado com o ID:
glm-5.2
- Marque esse modelo como ativo.
- Use o teste de chave de API do Cursor para validar a conexão.
- Envie um prompt simples para confirmar o funcionamento.
Depois disso, o GLM-5.2 alimenta o chat e as edições inline do Cursor.
Se você já usou o Cursor com outras versões do GLM, as diferenças descritas em Claude Code vs Cursor com GLM-4.7 continuam relevantes: Cursor é mais fluido para edições inline, enquanto Claude Code e Cline tendem a funcionar melhor em execuções agenticas autônomas e de várias etapas.
Configuração lado a lado
Use esta tabela para copiar os valores corretos para cada ferramenta:
| Configuração | Claude Code | Cline | Cursor |
|---|---|---|---|
| Formato da API | Compatível com Anthropic | Compatível com OpenAI | Compatível com OpenAI |
| URL Base | https://api.z.ai/api/coding/paas/v4 |
https://api.z.ai/api/paas/v4/ |
https://api.z.ai/api/paas/v4/ |
| ID do Modelo | glm-5.2[1m] |
glm-5.2 |
glm-5.2 |
| Tipo de chave | Chave do Plano de Codificação GLM | Chave de API | Chave de API |
| Janela de contexto | CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 |
1000000 |
Padrão do modelo |
| Timeout | API_TIMEOUT_MS=3000000 |
n/a | n/a |
| Esforço de raciocínio | Máximo, recomendado para codificação | Padrão do provedor | Padrão do provedor |
Os dois erros mais comuns são:
- Usar a URL base errada para o tipo de ferramenta.
- Esquecer
glm-5.2[1m]eAPI_TIMEOUT_MS=3000000no Claude Code.
Teste sua configuração com uma chamada de API real
Antes de depender da ferramenta, valide a chave e o modelo com uma chamada direta. Isso separa problemas de credenciais de problemas da configuração do editor.
curl https://api.z.ai/api/paas/v4/chat/completions \
-H "Authorization: Bearer $ZAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.2",
"messages": [
{
"role": "user",
"content": "Escreva uma função em Python que inverta uma lista encadeada."
}
],
"thinking": {
"type": "enabled"
},
"reasoning_effort": "max",
"stream": false
}'
Se a chamada retornar uma conclusão, sua chave e o ID do modelo estão corretos. Qualquer erro restante provavelmente está na configuração do Claude Code, Cline ou Cursor.
Você também pode salvar essa requisição em um cliente de API. Se estiver testando o GLM-5.2 junto com seus próprios endpoints de backend, o Apidog permite importar o curl, gerenciar Authorization ou ANTHROPIC_API_KEY como variável de ambiente e reproduzir chamadas sem reescrever o comando. Você pode baixar o Apidog e importar o curl acima diretamente.
Qual ferramenta você deve usar?
Depende do fluxo de trabalho.
-
Claude Code: melhor para execuções longas no terminal, refatorações grandes e mudanças em todo o repositório. É o único dos três que usa explicitamente
glm-5.2[1m]. - Cline: bom equilíbrio para quem trabalha no VS Code e quer um agente visível dentro do editor, com rastreamento de chamadas de ferramenta.
- Cursor: melhor para edições rápidas, chat no editor e fluxo de autocomplete/edição inline.
Para comparar planos e recursos, veja Claude Code vs Codex vs Cursor vs MiniMax vs GLM Plan. Para avaliar o modelo contra alternativas de fronteira, consulte GLM-5.2 vs GPT-5.5, Claude Opus e Gemini e a análise de benchmarks. Se você está migrando de versão, GLM-5.2 vs GLM-5.1 detalha as mudanças.
FAQ
Por que uso glm-5.2[1m] no Claude Code, mas glm-5.2 no Cline e no Cursor?
Porque [1m] é uma convenção usada no Claude Code para selecionar a variante de contexto de 1 milhão de tokens pelo endpoint de codificação. Cline e Cursor usam o ID simples glm-5.2 no endpoint compatível com OpenAI.
O que fazer se o Claude Code exceder o tempo limite em tarefas longas?
Defina:
export API_TIMEOUT_MS=3000000
Isso dá tempo suficiente para respostas com contexto grande e raciocínio máximo. Sem esse ajuste, o Claude Code pode abortar antes de o modelo concluir.
Preciso do Plano de Codificação GLM ou posso usar pagamento conforme o uso?
Ambos podem funcionar dependendo do endpoint e da ferramenta, mas o endpoint de codificação usado pelo Claude Code espera uma chave do Plano de Codificação GLM. Para uso intenso diário, os níveis mensais Lite, Pro, Max e Team podem fazer mais sentido do que cobrança por token. Confirme os preços atuais em z.ai.
Qual URL base devo usar no Claude Code?
Use:
https://api.z.ai/api/coding/paas/v4
Algumas fontes listam:
https://open.z.ai/api/paas/v4
Se houver erro 404 ou autenticação falhar, teste o outro host e confira a documentação da Z.ai. A URL https://api.z.ai/api/paas/v4/ é para Cline e Cursor, não para Claude Code.
O GLM-5.2 processa imagens?
Não há variante de visão confirmada para o GLM-5.2. Ele é um modelo de codificação e raciocínio texto-para-texto. Não assuma suporte a imagens até que a Z.ai lance uma variante específica.
Conclusão
Para usar o GLM-5.2 em ferramentas de codificação, ajuste três pontos: URL base, ID do modelo e janela de contexto. No Claude Code, use o endpoint compatível com Anthropic, glm-5.2[1m], CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 e API_TIMEOUT_MS=3000000. No Cline e no Cursor, use o endpoint compatível com OpenAI e o modelo glm-5.2.
Se você quiser rodar o modelo fora dessas ferramentas, veja como usar o GLM-5.2 gratuitamente e a análise de preços do GLM-5.2. Também é possível obter os pesos no Hugging Face ou puxar o modelo com Ollama para uso local.



Top comments (0)