A Alibaba lançou o Qwen 3.7 discretamente. Os modelos de prévia Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview apareceram primeiro em uma arena pública de modelos em 14 de maio de 2026, sem post oficial e sem API pública. A confirmação veio no Alibaba Cloud Summit em Hangzhou, em 20 de maio. Se você quer testar o modelo sem pagar, o ponto prático é separar acesso realmente gratuito de testes pagos com rótulo “free”.
Este guia mostra as formas confirmadas de usar o Qwen 3.7 sem custo em maio de 2026. Para cada caminho, veja o que dá para fazer, quais são os limites e quando vale a pena usar.
💡 Se você pretende integrar o modelo em um app, uma ferramenta como o Apidog ajuda a enviar a requisição, inspecionar respostas em streaming e salvar chamadas antes de levar para produção. Se ainda está avaliando o modelo, veja também o guia sobre o que é o Qwen 3.7, com arquitetura e benchmarks.
TL;DR
Em maio de 2026, o Qwen 3.7 ainda está em prévia. O acesso gratuito real está limitado a:
- Qwen Chat (chat.qwen.ai): conta gratuita, modelos de prévia disponíveis e limites de taxa.
- Arenas públicas de modelos: testes A/B cegos para comparar respostas e votar.
- Créditos de API da Alibaba Cloud: teste por tempo limitado para novas contas, não uma camada gratuita permanente.
O que não existe hoje para o Qwen 3.7:
- pesos abertos para rodar localmente;
- execução via Ollama ou LM Studio;
- camada gratuita no OpenRouter;
- endpoint público gratuito em agregadores.
Essas opções existem ou existiram para versões anteriores, como Qwen 3.6, mas não para o Qwen 3.7 neste momento.
O que o Qwen 3.7 é
Antes de escolher um caminho de acesso, confirme qual modelo você está testando.
O Qwen 3.7 foi apresentado em duas variantes de prévia:
-
Qwen3.7-Max-Preview: modelo principal, voltado para tarefas longas de agente. -
Qwen3.7-Plus-Preview: variante menor e mais equilibrada, voltada para raciocínio e codificação com menor custo.
Segundo a Alibaba, o Qwen3.7-Max-Preview sustentou uma tarefa única por cerca de 35 horas e realizou mais de 1.000 chamadas de ferramentas em testes internos. Ambos os modelos têm janela de contexto de 1 milhão de tokens e, durante a prévia, operam apenas no modo de pensamento. Pesquisa na web e interpretador de código estão desativados por enquanto.
O detalhe mais importante: o Qwen3.7-Max-Preview é proprietário. Os pesos não são públicos e a Alibaba não divulgou a contagem de parâmetros. A Alibaba afirmou que a variante Plus será open source, mas, em maio de 2026, nenhum peso do Qwen 3.7 foi lançado.
Portanto, se um tutorial diz para “baixar o Qwen 3.7” e rodar localmente, provavelmente ele está confundindo o modelo com o Qwen 3.6 ou antecipando um lançamento que ainda não ocorreu.
Caminho 1: Qwen Chat
A forma gratuita mais direta de usar o Qwen 3.7 é o app oficial em chat.qwen.ai.
Como usar
- Acesse chat.qwen.ai.
- Entre como convidado para um teste rápido ou crie uma conta gratuita.
- Faça login com Google, GitHub, Apple ou e-mail para obter limites maiores e histórico salvo.
- Abra o seletor de modelos.
- Escolha
Qwen3.7-Max-PreviewouQwen3.7-Plus-Preview. - Use o modo de pensamento, que durante a prévia é o modo principal disponível.
O que dá para testar
Você pode usar o Qwen Chat para:
- refatorar funções;
- revisar código;
- explicar erros;
- resumir documentos;
- analisar imagens;
- testar prompts longos;
- comparar raciocínio com outros modelos.
Exemplo de prompt prático para desenvolvedores:
Refatore esta função JavaScript para reduzir complexidade ciclomática.
Explique as mudanças e aponte possíveis efeitos colaterais.
[código aqui]
Outro exemplo:
Analise este contrato de API e identifique inconsistências entre nomes de campos,
tipos esperados e possíveis erros de validação.
[cole o schema ou documentação aqui]
Limites
Há duas limitações principais:
Ferramentas desativadas
Pesquisa na web e interpretador de código não estão ativos nos modelos de prévia. O modelo não navega em tempo real nem executa código em sandbox.Limites de taxa
O Qwen Chat não publica números exatos. Uso intenso pode atingir limite. Conta logada tem mais margem que sessão de convidado, mas nenhuma opção é ilimitada.
Quando usar
Use o Qwen Chat se você quer avaliar qualidade sem escrever integração. É o melhor ponto de partida para desenvolvedores, estudantes, escritores técnicos e equipes comparando modelos.
Se depois você quiser chamar o modelo via código, veja o guia sobre como usar a API do Qwen 3.7.
Caminho 2: arenas públicas de modelos
O Qwen 3.7 apareceu publicamente em placares de arenas antes de ter API pública. Nessas plataformas, você envia um prompt, recebe duas respostas anônimas e vota na melhor.
Como testar
O fluxo típico é:
- Abra uma arena pública de modelos.
- Escolha o modo “battle” ou comparação lado a lado.
- Envie um prompt.
- Compare as duas respostas.
- Vote na melhor.
- Em alguns casos, veja quais modelos responderam depois da votação.
Em modo cego, você não escolhe o modelo. Isso reduz viés, mas também impede garantir que uma resposta específica veio do Qwen 3.7.
Algumas arenas também oferecem modo direto, em que você seleciona um modelo nomeado. Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview apareceram como opções selecionáveis.
Bons prompts para comparar modelos
Use prompts que revelem diferenças práticas:
Explique este bug de concorrência em Go e proponha uma correção segura.
[código aqui]
Escreva um plano de migração de uma API REST para uma arquitetura orientada a eventos.
Inclua riscos, etapas e critérios de rollback.
Compare duas abordagens para cache em uma API Node.js:
Redis compartilhado vs cache local em memória.
Inclua trade-offs operacionais.
Limites
A arena é boa para avaliação, não para produção.
Você não terá:
- API;
- upload de arquivos;
- histórico confiável;
- controle total do modelo;
- throughput previsível.
Além disso, em modo cego, uma resposta pode ou não vir do Qwen 3.7.
Quando usar
Use arenas para comparação direta. É útil se você quer saber como o Qwen 3.7 se comporta contra outros modelos de ponta em prompts reais.
Para uma comparação estruturada, veja Qwen 3.7 vs GPT-5.5 vs Opus 4.7.
Caminho 3: execução local com Ollama ou LM Studio
Este caminho ainda não está disponível para o Qwen 3.7.
Por que não funciona
Para rodar um modelo localmente, você precisa dos pesos. Esses arquivos contêm os parâmetros treinados do modelo.
No caso do Qwen 3.7:
-
Qwen3.7-Max-Previewé proprietário; - a Alibaba não liberou seus pesos;
-
Qwen3.7-Plusfoi prometido como open source; - em maio de 2026, nenhum peso do Qwen 3.7 foi publicado.
Logo, não há nada para baixar e nada para carregar no Ollama ou no LM Studio.
Se você encontrar um comando como este:
ollama run qwen3.7
verifique o nome real do modelo. É muito provável que o tutorial esteja apontando para Qwen 3.6 ou para outro modelo da família Qwen.
O que usar localmente hoje
Se você precisa de inferência local, offline e sem custo de API, use a geração anterior. O Qwen 3.6 tem pesos abertos, incluindo:
- modelo denso de 27B;
- variante mixture-of-experts de 35B;
- licença Apache 2.0.
Você pode baixá-los pelo Hugging Face e rodar via Ollama ou LM Studio.
O caminho prático é:
- quer especificamente Qwen 3.7? Use Qwen Chat.
- quer um modelo Qwen local e gratuito hoje? Use Qwen 3.6.
- quer Qwen 3.7 local? Aguarde os pesos do
Qwen3.7-Plus.
Quando usar
Execução local é ideal para:
- requisitos fortes de privacidade;
- protótipos offline;
- ambientes sem dependência de API;
- controle total sobre dados;
- custo zero por token.
Mas, por enquanto, esse caso é atendido pelo Qwen 3.6, não pelo Qwen 3.7.
Caminho 4: agregadores de API
Agregadores como OpenRouter permitem chamar vários modelos com uma única chave de API. Alguns modelos ficam disponíveis em camadas gratuitas. Para o Qwen 3.7, essa opção ainda não existe.
Estado atual
Em maio de 2026:
- o OpenRouter lista vários modelos Qwen;
- as entradas mais recentes param na geração Qwen 3.6;
- não há
Qwen3.7-Max; - não há
Qwen3.7-Plus; - não há endpoint gratuito do Qwen 3.7.
Outros agregadores estão na mesma situação. Uma listagem de terceiros só deve aparecer depois que a API oficial estiver ativa.
O que dá para fazer agora
Você pode construir seu protótipo usando um modelo Qwen mais antigo e deixar o ID do modelo configurável.
Exemplo simples em JavaScript:
const model = process.env.MODEL_ID || "qwen/qwen-3.6";
const response = await fetch("https://api.exemplo.com/v1/chat/completions", {
method: "POST",
headers: {
"Authorization": `Bearer ${process.env.API_KEY}`,
"Content-Type": "application/json"
},
body: JSON.stringify({
model,
messages: [
{
role: "user",
content: "Explique este erro e sugira uma correção."
}
]
})
});
Quando o Qwen 3.7 for listado, você troca apenas a variável:
MODEL_ID=qwen/qwen-3.7-plus-preview
Isso evita acoplar o código a um modelo específico antes da disponibilidade real.
Atenção com camadas gratuitas
Camadas gratuitas em agregadores podem ter:
- logs de prompts e respostas;
- capacidade compartilhada;
- latência variável;
- limites de taxa;
- regras diferentes para uso comercial.
Não envie dados confidenciais por endpoints gratuitos sem revisar os termos.
Quando usar
Use agregadores se você quer alternar entre modelos facilmente e prototipar com baixo custo. Para Qwen 3.7, esse caminho é “aguarde”, não “use agora”.
Caminho 5: créditos gratuitos da Alibaba Cloud
A última rota é o teste com créditos para novas contas no Alibaba Cloud Model Studio, plataforma que hospeda a API oficial do Qwen.
O que são esses créditos
Provedores de nuvem normalmente oferecem créditos iniciais ou um bloco de tokens gratuitos para novas contas. Quando a API pública do Qwen 3.7 estiver disponível após o summit, esses créditos deverão poder ser usados para chamadas reais.
Isso permite testar a API sem cobrança imediata.
Mas há uma diferença importante:
Créditos gratuitos não são uma camada gratuita permanente.
Eles expiram. O limite acaba. Depois disso, passam a valer os preços padrão.
A geração estável do Qwen 3.6 já é cobrada por milhão de tokens na mesma plataforma. O preço do Qwen 3.7 deve ser anunciado quando a API estiver disponível.
Como usar de forma segura
Para evitar surpresa de custo:
- Crie uma conta separada para teste.
- Verifique a validade dos créditos.
- Defina alertas de billing.
- Defina limites de uso, se a plataforma permitir.
- Teste com prompts pequenos antes de enviar contexto longo.
- Registre tokens de entrada e saída.
- Só depois integre em um fluxo automatizado.
Exemplo de checklist para testes de API:
[ ] Endpoint confirmado
[ ] Modelo correto selecionado
[ ] Chave de API em variável de ambiente
[ ] Timeout configurado
[ ] Retry com backoff
[ ] Logging sem dados sensíveis
[ ] Limite de custo configurado
[ ] Teste com payload mínimo
[ ] Teste com payload real
Quando usar
Use créditos se você já está pronto para escrever integração real e aceita migrar para uso pago caso o modelo funcione bem.
Não use essa opção se seu requisito é custo zero permanente.
A mesma lógica vale para outros provedores. Veja também o guia sobre como usar o Gemini 3.5 gratuitamente.
Comparação dos caminhos gratuitos do Qwen 3.7
| Caminho | Realmente gratuito? | O que você obtém | Principais limites | Melhor para |
|---|---|---|---|---|
| Qwen Chat (chat.qwen.ai) | Sim | Modelo de prévia completo, UI de chat, imagem e documento | Limites de taxa; ferramentas desativadas | Avaliar o modelo sem código |
| Arenas públicas | Sim | Comparação cega ou nomeada em caixa de chat | Sem API, sem arquivos, throughput compartilhado | Comparar modelos diretamente |
| Ollama ou LM Studio | Não para 3.7 | Nada ainda; não há pesos do Qwen 3.7 | Pesos não publicados | Use Qwen 3.6 localmente |
| OpenRouter e agregadores | Não para 3.7 | Nenhum modelo Qwen 3.7 listado | Sem API pública disponível | Aguarde ou use modelos Qwen anteriores |
| Créditos Alibaba Cloud | Teste temporário | Chamadas reais de API dentro do crédito | Créditos expiram; depois é pago | Testar integração oficial |
Decisão rápida
Use esta regra:
Quero testar a qualidade do Qwen 3.7 sem código
→ Qwen Chat
Quero comparar contra outros modelos
→ Arena pública
Quero rodar localmente
→ Não dá com Qwen 3.7; use Qwen 3.6
Quero API gratuita permanente
→ Não existe para Qwen 3.7
Quero testar a API oficial sem custo imediato
→ Créditos Alibaba Cloud, com limite e expiração
Conclusão
O acesso gratuito ao Qwen 3.7 ainda é limitado porque o modelo está em prévia.
O resumo prático:
-
Qwen Chat é o melhor caminho gratuito agora. Use conta gratuita, escolha
Qwen3.7-Max-PreviewouQwen3.7-Plus-Previewe avalie o modelo com prompts reais. - Arenas públicas são úteis para comparação. Elas não substituem API, mas ajudam a comparar respostas sem cadastro.
- Você não pode rodar Qwen 3.7 localmente. Nenhum peso do Qwen 3.7 foi publicado.
- Não há camada gratuita de API em agregadores. OpenRouter e similares ainda não listam Qwen 3.7.
- Créditos da Alibaba Cloud são teste, não gratuidade permanente. Use para validar integração, mas acompanhe custos.
Quando a API do Qwen 3.7 estiver totalmente pública, as opções devem aumentar. Até lá, comece pelo Qwen Chat. Se for avançar para API, teste as chamadas no Apidog: envie a requisição, inspecione a resposta, salve como caso reutilizável e gere documentação para sua equipe. Você também pode baixar o Apidog gratuitamente.

Top comments (0)