O Kimi K2.7 Code, da Moonshot, é um modelo de pesos abertos com trilhões de parâmetros, otimizado para tarefas de codificação. Na prática, isso oferece três formas reais de uso gratuito: conversar pelo navegador, usar a CLI com cota inicial ou baixar os pesos e hospedar o modelo por conta própria, sem custo por token.
Abaixo estão os caminhos que realmente funcionam, organizados do mais simples ao mais avançado, com quando usar cada um.
TL;DR
- Chat gratuito: use o aplicativo web ou móvel do Kimi.
- Agente com cota gratuita: use a CLI Kimi Code para trabalhar direto no terminal.
- Pesos gratuitos: baixe o modelo no Hugging Face e auto-hospede.
- API hospedada: quando precisar escalar, a API custa US$0,95 por milhão de tokens de entrada e US$4,00 por milhão de tokens de saída.
Método 1: Use o aplicativo web Kimi para perguntas rápidas
A forma mais simples de testar o Kimi K2.7 Code é pelo navegador.
Fluxo recomendado:
- Acesse o aplicativo web Kimi.
- Faça login.
- Cole seu trecho de código, erro ou requisito.
- Peça uma explicação, correção ou implementação.
Use esse caminho quando você precisar:
- Entender um stack trace.
- Revisar uma função.
- Gerar um protótipo rápido.
- Comparar duas abordagens antes de implementar.
Exemplo de prompt:
Analise este erro e explique a causa provável. Em seguida, sugira uma correção mínima.
[cole aqui o stack trace]
Contexto:
- Linguagem:
- Framework:
- O que eu esperava:
- O que aconteceu:
Limitação: o chat não acessa seus arquivos locais nem executa comandos. Para isso, use a CLI.
Método 2: Use o aplicativo Kimi no celular
O aplicativo móvel oferece acesso gratuito ao chat do Kimi. Ele é útil quando você quer consultar algo fora da estação de trabalho.
Bons casos de uso:
- Ler e resumir um trecho de código.
- Anotar uma ideia de feature.
- Pedir uma explicação rápida sobre uma API, erro ou arquitetura.
- Preparar um prompt para usar depois na CLI.
A vantagem é a conveniência. A limitação é a mesma do chat web: ele não atua diretamente no seu repositório.
Método 3: Execute o agente Kimi Code com a cota gratuita
A CLI Kimi Code é o agente de codificação da Moonshot para terminal. Ela pode explorar seu projeto, editar arquivos e executar comandos.
Instale com:
curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash
Depois, inicie a CLI:
kimi
Faça login:
/login
Verifique sua cota:
/usage
Antes de pedir uma alteração real, inicialize o contexto do projeto:
/init
Isso ajuda o agente a entender a estrutura do repositório antes de consumir cota em uma tarefa específica.
Exemplo de tarefa prática:
Analise este projeto, encontre onde as rotas de autenticação são definidas e adicione testes para o fluxo de login. Execute a suíte de testes relacionada e corrija falhas simples.
Use a CLI quando você quer que o modelo:
- Navegue pelo repositório.
- Edite arquivos.
- Execute testes.
- Refatore código.
- Implemente uma issue pequena de ponta a ponta.
A cota gratuita é renovada em um ciclo de 7 dias. Quando acabar, você pode aguardar a renovação, usar a API paga ou auto-hospedar.
Método 4: Baixe os pesos e auto-hospede
Se você quer evitar completamente custo por token, o caminho é baixar os pesos do modelo e executá-lo no seu próprio hardware.
O Kimi K2.7 Code está disponível no Hugging Face sob uma licença MIT modificada.
Esse caminho faz sentido quando:
- Seus dados precisam permanecer no seu ambiente.
- Você quer previsibilidade de custo.
- Seu volume de uso tornaria tokens hospedados caros.
- Você já tem infraestrutura de GPU disponível.
Atenção: por ser um modelo com trilhões de parâmetros, os pesos completos exigem muita memória de GPU.
Opções práticas:
- vLLM, SGLang ou KTransformers: indicados se você tem hardware suficiente.
- Versões quantizadas: reduzem o uso de memória, mas podem sacrificar qualidade.
Se você já executou modelos Kimi localmente, o processo é parecido com o guia para executar o Kimi K2.5 localmente. A principal diferença é o nome do modelo e os requisitos de hardware.
Método 5: Use a API hospedada quando passar dos limites gratuitos
Quando a cota gratuita não for suficiente e auto-hospedar não for viável, use a API hospedada.
Ela não é gratuita, mas o custo é baixo:
- Entrada: US$0,95 por milhão de tokens.
- Saída: US$4,00 por milhão de tokens.
- Cache hit: US$0,19 por milhão de tokens.
Para projetos paralelos, protótipos e automações pequenas, isso costuma representar poucos centavos de uso real.
A configuração completa está no guia da API Kimi K2.7 Code.
Qual caminho escolher?
| Você quer... | Use |
|---|---|
| Fazer perguntas rápidas de codificação | Aplicativo web Kimi |
| Consultar código pelo celular | Aplicativo móvel Kimi |
| Deixar um agente editar arquivos e executar comandos | CLI Kimi Code com cota gratuita |
| Evitar custo por token e manter dados privados | Auto-hospedagem dos pesos abertos |
| Escalar além dos limites gratuitos | API hospedada |
Na prática, o fluxo mais simples é:
- Comece pelo chat web.
- Use a CLI quando quiser trabalhar dentro do repositório.
- Auto-hospede apenas se privacidade, volume ou custo justificarem.
- Use a API hospedada quando precisar integrar o modelo em aplicações.
Teste os endpoints antes de depender deles
Se você usar o Kimi K2.7 Code para criar algo que chama uma API, valide o endpoint antes de colocar o fluxo em produção.
Com o Apidog, você pode:
- Enviar uma requisição de teste.
- Conferir a resposta.
- Verificar uso de tokens.
- Salvar a chamada como uma verificação reutilizável.
- Testar endpoints compatíveis com OpenAI, incluindo os da Moonshot.
Você também pode baixar o Apidog para validar suas chamadas enquanto desenvolve.
Perguntas Frequentes
O Kimi K2.7 Code é realmente gratuito?
Sim, dependendo do caminho escolhido. O chat web e móvel são gratuitos, a CLI inclui uma cota gratuita e os pesos abertos podem ser baixados sem custo. Você paga apenas se usar a API hospedada ou se precisar manter seu próprio hardware.
Preciso de chave de API para usar o chat gratuito?
Não. O aplicativo web e o aplicativo móvel funcionam com login de conta.
Posso executar o modelo na minha própria máquina?
Sim. Baixe os pesos no Hugging Face e sirva o modelo com vLLM, SGLang ou KTransformers. Se sua GPU for limitada, considere uma versão quantizada.
Quanto hardware é necessário para auto-hospedar?
Como o Kimi K2.7 Code é um modelo com trilhões de parâmetros, os pesos completos exigem muita memória de GPU. Versões quantizadas reduzem a exigência, mas podem reduzir a qualidade.
O que acontece quando a cota gratuita da CLI acaba?
A cota é renovada em um ciclo de 7 dias. Se você precisar continuar antes da renovação, use a API paga por token ou auto-hospede o modelo.
Existe nível gratuito na API?
Novas contas podem incluir créditos iniciais, mas o uso contínuo da API é pago por token. O preço informado é US$0,95 por milhão de tokens de entrada e US$4,00 por milhão de tokens de saída.
Resumo
O Kimi K2.7 Code oferece mais caminhos gratuitos do que muitos modelos de codificação porque seus pesos são abertos. Para começar rápido, use o chat web. Para trabalhar diretamente em um repositório, use a CLI Kimi Code com cota gratuita. Para custo zero por token e maior controle sobre dados, baixe os pesos no Hugging Face e auto-hospede. Se precisar escalar sem manter infraestrutura, use a API hospedada.

Top comments (0)