Lucas

Posted on Jun 15 • Originally published at apidog.com

Como Usar Código Kimi K2.7 de Graça

O Kimi K2.7 Code, da Moonshot, é um modelo de pesos abertos com trilhões de parâmetros, otimizado para tarefas de codificação. Na prática, isso oferece três formas reais de uso gratuito: conversar pelo navegador, usar a CLI com cota inicial ou baixar os pesos e hospedar o modelo por conta própria, sem custo por token.

Experimente o Apidog hoje

Abaixo estão os caminhos que realmente funcionam, organizados do mais simples ao mais avançado, com quando usar cada um.

TL;DR

Chat gratuito: use o aplicativo web ou móvel do Kimi.
Agente com cota gratuita: use a CLI Kimi Code para trabalhar direto no terminal.
Pesos gratuitos: baixe o modelo no Hugging Face e auto-hospede.
API hospedada: quando precisar escalar, a API custa US$0,95 por milhão de tokens de entrada e US$4,00 por milhão de tokens de saída.

Método 1: Use o aplicativo web Kimi para perguntas rápidas

A forma mais simples de testar o Kimi K2.7 Code é pelo navegador.

Fluxo recomendado:

Acesse o aplicativo web Kimi.
Faça login.
Cole seu trecho de código, erro ou requisito.
Peça uma explicação, correção ou implementação.

Use esse caminho quando você precisar:

Entender um stack trace.
Revisar uma função.
Gerar um protótipo rápido.
Comparar duas abordagens antes de implementar.

Exemplo de prompt:

Analise este erro e explique a causa provável. Em seguida, sugira uma correção mínima.

[cole aqui o stack trace]

Contexto:
- Linguagem:
- Framework:
- O que eu esperava:
- O que aconteceu:

Limitação: o chat não acessa seus arquivos locais nem executa comandos. Para isso, use a CLI.

Método 2: Use o aplicativo Kimi no celular

O aplicativo móvel oferece acesso gratuito ao chat do Kimi. Ele é útil quando você quer consultar algo fora da estação de trabalho.

Bons casos de uso:

Ler e resumir um trecho de código.
Anotar uma ideia de feature.
Pedir uma explicação rápida sobre uma API, erro ou arquitetura.
Preparar um prompt para usar depois na CLI.

A vantagem é a conveniência. A limitação é a mesma do chat web: ele não atua diretamente no seu repositório.

Método 3: Execute o agente Kimi Code com a cota gratuita

A CLI Kimi Code é o agente de codificação da Moonshot para terminal. Ela pode explorar seu projeto, editar arquivos e executar comandos.

Instale com:

curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash

Depois, inicie a CLI:

kimi

Faça login:

/login

Verifique sua cota:

/usage

Antes de pedir uma alteração real, inicialize o contexto do projeto:

/init

Isso ajuda o agente a entender a estrutura do repositório antes de consumir cota em uma tarefa específica.

Exemplo de tarefa prática:

Analise este projeto, encontre onde as rotas de autenticação são definidas e adicione testes para o fluxo de login. Execute a suíte de testes relacionada e corrija falhas simples.

Use a CLI quando você quer que o modelo:

Navegue pelo repositório.
Edite arquivos.
Execute testes.
Refatore código.
Implemente uma issue pequena de ponta a ponta.

A cota gratuita é renovada em um ciclo de 7 dias. Quando acabar, você pode aguardar a renovação, usar a API paga ou auto-hospedar.

Método 4: Baixe os pesos e auto-hospede

Se você quer evitar completamente custo por token, o caminho é baixar os pesos do modelo e executá-lo no seu próprio hardware.

O Kimi K2.7 Code está disponível no Hugging Face sob uma licença MIT modificada.

Esse caminho faz sentido quando:

Seus dados precisam permanecer no seu ambiente.
Você quer previsibilidade de custo.
Seu volume de uso tornaria tokens hospedados caros.
Você já tem infraestrutura de GPU disponível.

Atenção: por ser um modelo com trilhões de parâmetros, os pesos completos exigem muita memória de GPU.

Opções práticas:

vLLM, SGLang ou KTransformers: indicados se você tem hardware suficiente.
Versões quantizadas: reduzem o uso de memória, mas podem sacrificar qualidade.

Se você já executou modelos Kimi localmente, o processo é parecido com o guia para executar o Kimi K2.5 localmente. A principal diferença é o nome do modelo e os requisitos de hardware.

Método 5: Use a API hospedada quando passar dos limites gratuitos

Quando a cota gratuita não for suficiente e auto-hospedar não for viável, use a API hospedada.

Ela não é gratuita, mas o custo é baixo:

Entrada: US$0,95 por milhão de tokens.
Saída: US$4,00 por milhão de tokens.
Cache hit: US$0,19 por milhão de tokens.

Para projetos paralelos, protótipos e automações pequenas, isso costuma representar poucos centavos de uso real.

A configuração completa está no guia da API Kimi K2.7 Code.

Qual caminho escolher?

Você quer...	Use
Fazer perguntas rápidas de codificação	Aplicativo web Kimi
Consultar código pelo celular	Aplicativo móvel Kimi
Deixar um agente editar arquivos e executar comandos	CLI Kimi Code com cota gratuita
Evitar custo por token e manter dados privados	Auto-hospedagem dos pesos abertos
Escalar além dos limites gratuitos	API hospedada

Na prática, o fluxo mais simples é:

Comece pelo chat web.
Use a CLI quando quiser trabalhar dentro do repositório.
Auto-hospede apenas se privacidade, volume ou custo justificarem.
Use a API hospedada quando precisar integrar o modelo em aplicações.

Teste os endpoints antes de depender deles

Se você usar o Kimi K2.7 Code para criar algo que chama uma API, valide o endpoint antes de colocar o fluxo em produção.

Com o Apidog, você pode:

Enviar uma requisição de teste.
Conferir a resposta.
Verificar uso de tokens.
Salvar a chamada como uma verificação reutilizável.
Testar endpoints compatíveis com OpenAI, incluindo os da Moonshot.

Você também pode baixar o Apidog para validar suas chamadas enquanto desenvolve.

Perguntas Frequentes

O Kimi K2.7 Code é realmente gratuito?

Sim, dependendo do caminho escolhido. O chat web e móvel são gratuitos, a CLI inclui uma cota gratuita e os pesos abertos podem ser baixados sem custo. Você paga apenas se usar a API hospedada ou se precisar manter seu próprio hardware.

Preciso de chave de API para usar o chat gratuito?

Não. O aplicativo web e o aplicativo móvel funcionam com login de conta.

Posso executar o modelo na minha própria máquina?

Sim. Baixe os pesos no Hugging Face e sirva o modelo com vLLM, SGLang ou KTransformers. Se sua GPU for limitada, considere uma versão quantizada.

Quanto hardware é necessário para auto-hospedar?

Como o Kimi K2.7 Code é um modelo com trilhões de parâmetros, os pesos completos exigem muita memória de GPU. Versões quantizadas reduzem a exigência, mas podem reduzir a qualidade.

O que acontece quando a cota gratuita da CLI acaba?

A cota é renovada em um ciclo de 7 dias. Se você precisar continuar antes da renovação, use a API paga por token ou auto-hospede o modelo.

Existe nível gratuito na API?

Novas contas podem incluir créditos iniciais, mas o uso contínuo da API é pago por token. O preço informado é US$0,95 por milhão de tokens de entrada e US$4,00 por milhão de tokens de saída.

Resumo

O Kimi K2.7 Code oferece mais caminhos gratuitos do que muitos modelos de codificação porque seus pesos são abertos. Para começar rápido, use o chat web. Para trabalhar diretamente em um repositório, use a CLI Kimi Code com cota gratuita. Para custo zero por token e maior controle sobre dados, baixe os pesos no Hugging Face e auto-hospede. Se precisar escalar sem manter infraestrutura, use a API hospedada.

DEV Community