Lucas

Posted on May 21 • Originally published at apidog.com

Como Usar Qwen 3.7 Grátis?

#ai #llm #news #tutorial

A Alibaba lançou o Qwen 3.7 discretamente. Os modelos de prévia Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview apareceram primeiro em uma arena pública de modelos em 14 de maio de 2026, sem post oficial e sem API pública. A confirmação veio no Alibaba Cloud Summit em Hangzhou, em 20 de maio. Se você quer testar o modelo sem pagar, o ponto prático é separar acesso realmente gratuito de testes pagos com rótulo “free”.

Experimente o Apidog hoje

Este guia mostra as formas confirmadas de usar o Qwen 3.7 sem custo em maio de 2026. Para cada caminho, veja o que dá para fazer, quais são os limites e quando vale a pena usar.

💡 Se você pretende integrar o modelo em um app, uma ferramenta como o Apidog ajuda a enviar a requisição, inspecionar respostas em streaming e salvar chamadas antes de levar para produção. Se ainda está avaliando o modelo, veja também o guia sobre o que é o Qwen 3.7, com arquitetura e benchmarks.

TL;DR

Em maio de 2026, o Qwen 3.7 ainda está em prévia. O acesso gratuito real está limitado a:

Qwen Chat (chat.qwen.ai): conta gratuita, modelos de prévia disponíveis e limites de taxa.
Arenas públicas de modelos: testes A/B cegos para comparar respostas e votar.
Créditos de API da Alibaba Cloud: teste por tempo limitado para novas contas, não uma camada gratuita permanente.

O que não existe hoje para o Qwen 3.7:

pesos abertos para rodar localmente;
execução via Ollama ou LM Studio;
camada gratuita no OpenRouter;
endpoint público gratuito em agregadores.

Essas opções existem ou existiram para versões anteriores, como Qwen 3.6, mas não para o Qwen 3.7 neste momento.

O que o Qwen 3.7 é

Antes de escolher um caminho de acesso, confirme qual modelo você está testando.

O Qwen 3.7 foi apresentado em duas variantes de prévia:

Qwen3.7-Max-Preview: modelo principal, voltado para tarefas longas de agente.
Qwen3.7-Plus-Preview: variante menor e mais equilibrada, voltada para raciocínio e codificação com menor custo.

Segundo a Alibaba, o Qwen3.7-Max-Preview sustentou uma tarefa única por cerca de 35 horas e realizou mais de 1.000 chamadas de ferramentas em testes internos. Ambos os modelos têm janela de contexto de 1 milhão de tokens e, durante a prévia, operam apenas no modo de pensamento. Pesquisa na web e interpretador de código estão desativados por enquanto.

O detalhe mais importante: o Qwen3.7-Max-Preview é proprietário. Os pesos não são públicos e a Alibaba não divulgou a contagem de parâmetros. A Alibaba afirmou que a variante Plus será open source, mas, em maio de 2026, nenhum peso do Qwen 3.7 foi lançado.

Portanto, se um tutorial diz para “baixar o Qwen 3.7” e rodar localmente, provavelmente ele está confundindo o modelo com o Qwen 3.6 ou antecipando um lançamento que ainda não ocorreu.

Caminho 1: Qwen Chat

A forma gratuita mais direta de usar o Qwen 3.7 é o app oficial em chat.qwen.ai.

Como usar

Acesse chat.qwen.ai.
Entre como convidado para um teste rápido ou crie uma conta gratuita.
Faça login com Google, GitHub, Apple ou e-mail para obter limites maiores e histórico salvo.
Abra o seletor de modelos.
Escolha Qwen3.7-Max-Preview ou Qwen3.7-Plus-Preview.
Use o modo de pensamento, que durante a prévia é o modo principal disponível.

O que dá para testar

Você pode usar o Qwen Chat para:

refatorar funções;
revisar código;
explicar erros;
resumir documentos;
analisar imagens;
testar prompts longos;
comparar raciocínio com outros modelos.

Exemplo de prompt prático para desenvolvedores:

Refatore esta função JavaScript para reduzir complexidade ciclomática.
Explique as mudanças e aponte possíveis efeitos colaterais.

[código aqui]

Outro exemplo:

Analise este contrato de API e identifique inconsistências entre nomes de campos,
tipos esperados e possíveis erros de validação.

[cole o schema ou documentação aqui]

Limites

Há duas limitações principais:

Ferramentas desativadas

Pesquisa na web e interpretador de código não estão ativos nos modelos de prévia. O modelo não navega em tempo real nem executa código em sandbox.
Limites de taxa

O Qwen Chat não publica números exatos. Uso intenso pode atingir limite. Conta logada tem mais margem que sessão de convidado, mas nenhuma opção é ilimitada.

Quando usar

Use o Qwen Chat se você quer avaliar qualidade sem escrever integração. É o melhor ponto de partida para desenvolvedores, estudantes, escritores técnicos e equipes comparando modelos.

Se depois você quiser chamar o modelo via código, veja o guia sobre como usar a API do Qwen 3.7.

Caminho 2: arenas públicas de modelos

O Qwen 3.7 apareceu publicamente em placares de arenas antes de ter API pública. Nessas plataformas, você envia um prompt, recebe duas respostas anônimas e vota na melhor.

Como testar

O fluxo típico é:

Abra uma arena pública de modelos.
Escolha o modo “battle” ou comparação lado a lado.
Envie um prompt.
Compare as duas respostas.
Vote na melhor.
Em alguns casos, veja quais modelos responderam depois da votação.

Em modo cego, você não escolhe o modelo. Isso reduz viés, mas também impede garantir que uma resposta específica veio do Qwen 3.7.

Algumas arenas também oferecem modo direto, em que você seleciona um modelo nomeado. Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview apareceram como opções selecionáveis.

Bons prompts para comparar modelos

Use prompts que revelem diferenças práticas:

Explique este bug de concorrência em Go e proponha uma correção segura.

[código aqui]

Escreva um plano de migração de uma API REST para uma arquitetura orientada a eventos.
Inclua riscos, etapas e critérios de rollback.

Compare duas abordagens para cache em uma API Node.js:
Redis compartilhado vs cache local em memória.
Inclua trade-offs operacionais.

Limites

A arena é boa para avaliação, não para produção.

Você não terá:

API;
upload de arquivos;
histórico confiável;
controle total do modelo;
throughput previsível.

Além disso, em modo cego, uma resposta pode ou não vir do Qwen 3.7.

Quando usar

Use arenas para comparação direta. É útil se você quer saber como o Qwen 3.7 se comporta contra outros modelos de ponta em prompts reais.

Para uma comparação estruturada, veja Qwen 3.7 vs GPT-5.5 vs Opus 4.7.

Caminho 3: execução local com Ollama ou LM Studio

Este caminho ainda não está disponível para o Qwen 3.7.

Por que não funciona

Para rodar um modelo localmente, você precisa dos pesos. Esses arquivos contêm os parâmetros treinados do modelo.

No caso do Qwen 3.7:

Qwen3.7-Max-Preview é proprietário;
a Alibaba não liberou seus pesos;
Qwen3.7-Plus foi prometido como open source;
em maio de 2026, nenhum peso do Qwen 3.7 foi publicado.

Logo, não há nada para baixar e nada para carregar no Ollama ou no LM Studio.

Se você encontrar um comando como este:

ollama run qwen3.7

verifique o nome real do modelo. É muito provável que o tutorial esteja apontando para Qwen 3.6 ou para outro modelo da família Qwen.

O que usar localmente hoje

Se você precisa de inferência local, offline e sem custo de API, use a geração anterior. O Qwen 3.6 tem pesos abertos, incluindo:

modelo denso de 27B;
variante mixture-of-experts de 35B;
licença Apache 2.0.

Você pode baixá-los pelo Hugging Face e rodar via Ollama ou LM Studio.

O caminho prático é:

quer especificamente Qwen 3.7? Use Qwen Chat.
quer um modelo Qwen local e gratuito hoje? Use Qwen 3.6.
quer Qwen 3.7 local? Aguarde os pesos do Qwen3.7-Plus.

Quando usar

Execução local é ideal para:

requisitos fortes de privacidade;
protótipos offline;
ambientes sem dependência de API;
controle total sobre dados;
custo zero por token.

Mas, por enquanto, esse caso é atendido pelo Qwen 3.6, não pelo Qwen 3.7.

Caminho 4: agregadores de API

Agregadores como OpenRouter permitem chamar vários modelos com uma única chave de API. Alguns modelos ficam disponíveis em camadas gratuitas. Para o Qwen 3.7, essa opção ainda não existe.

Estado atual

Em maio de 2026:

o OpenRouter lista vários modelos Qwen;
as entradas mais recentes param na geração Qwen 3.6;
não há Qwen3.7-Max;
não há Qwen3.7-Plus;
não há endpoint gratuito do Qwen 3.7.

Outros agregadores estão na mesma situação. Uma listagem de terceiros só deve aparecer depois que a API oficial estiver ativa.

O que dá para fazer agora

Você pode construir seu protótipo usando um modelo Qwen mais antigo e deixar o ID do modelo configurável.

Exemplo simples em JavaScript:

const model = process.env.MODEL_ID || "qwen/qwen-3.6";

const response = await fetch("https://api.exemplo.com/v1/chat/completions", {
  method: "POST",
  headers: {
    "Authorization": `Bearer ${process.env.API_KEY}`,
    "Content-Type": "application/json"
  },
  body: JSON.stringify({
    model,
    messages: [
      {
        role: "user",
        content: "Explique este erro e sugira uma correção."
      }
    ]
  })
});

Quando o Qwen 3.7 for listado, você troca apenas a variável:

MODEL_ID=qwen/qwen-3.7-plus-preview

Isso evita acoplar o código a um modelo específico antes da disponibilidade real.

Atenção com camadas gratuitas

Camadas gratuitas em agregadores podem ter:

logs de prompts e respostas;
capacidade compartilhada;
latência variável;
limites de taxa;
regras diferentes para uso comercial.

Não envie dados confidenciais por endpoints gratuitos sem revisar os termos.

Quando usar

Use agregadores se você quer alternar entre modelos facilmente e prototipar com baixo custo. Para Qwen 3.7, esse caminho é “aguarde”, não “use agora”.

Caminho 5: créditos gratuitos da Alibaba Cloud

A última rota é o teste com créditos para novas contas no Alibaba Cloud Model Studio, plataforma que hospeda a API oficial do Qwen.

O que são esses créditos

Provedores de nuvem normalmente oferecem créditos iniciais ou um bloco de tokens gratuitos para novas contas. Quando a API pública do Qwen 3.7 estiver disponível após o summit, esses créditos deverão poder ser usados para chamadas reais.

Isso permite testar a API sem cobrança imediata.

Mas há uma diferença importante:

Créditos gratuitos não são uma camada gratuita permanente.

Eles expiram. O limite acaba. Depois disso, passam a valer os preços padrão.

A geração estável do Qwen 3.6 já é cobrada por milhão de tokens na mesma plataforma. O preço do Qwen 3.7 deve ser anunciado quando a API estiver disponível.

Como usar de forma segura

Para evitar surpresa de custo:

Crie uma conta separada para teste.
Verifique a validade dos créditos.
Defina alertas de billing.
Defina limites de uso, se a plataforma permitir.
Teste com prompts pequenos antes de enviar contexto longo.
Registre tokens de entrada e saída.
Só depois integre em um fluxo automatizado.

Exemplo de checklist para testes de API:

[ ] Endpoint confirmado
[ ] Modelo correto selecionado
[ ] Chave de API em variável de ambiente
[ ] Timeout configurado
[ ] Retry com backoff
[ ] Logging sem dados sensíveis
[ ] Limite de custo configurado
[ ] Teste com payload mínimo
[ ] Teste com payload real

Quando usar

Use créditos se você já está pronto para escrever integração real e aceita migrar para uso pago caso o modelo funcione bem.

Não use essa opção se seu requisito é custo zero permanente.

A mesma lógica vale para outros provedores. Veja também o guia sobre como usar o Gemini 3.5 gratuitamente.

Comparação dos caminhos gratuitos do Qwen 3.7

Caminho	Realmente gratuito?	O que você obtém	Principais limites	Melhor para
Qwen Chat (chat.qwen.ai)	Sim	Modelo de prévia completo, UI de chat, imagem e documento	Limites de taxa; ferramentas desativadas	Avaliar o modelo sem código
Arenas públicas	Sim	Comparação cega ou nomeada em caixa de chat	Sem API, sem arquivos, throughput compartilhado	Comparar modelos diretamente
Ollama ou LM Studio	Não para 3.7	Nada ainda; não há pesos do Qwen 3.7	Pesos não publicados	Use Qwen 3.6 localmente
OpenRouter e agregadores	Não para 3.7	Nenhum modelo Qwen 3.7 listado	Sem API pública disponível	Aguarde ou use modelos Qwen anteriores
Créditos Alibaba Cloud	Teste temporário	Chamadas reais de API dentro do crédito	Créditos expiram; depois é pago	Testar integração oficial

Decisão rápida

Use esta regra:

Quero testar a qualidade do Qwen 3.7 sem código
→ Qwen Chat

Quero comparar contra outros modelos
→ Arena pública

Quero rodar localmente
→ Não dá com Qwen 3.7; use Qwen 3.6

Quero API gratuita permanente
→ Não existe para Qwen 3.7

Quero testar a API oficial sem custo imediato
→ Créditos Alibaba Cloud, com limite e expiração

Conclusão

O acesso gratuito ao Qwen 3.7 ainda é limitado porque o modelo está em prévia.

O resumo prático:

Qwen Chat é o melhor caminho gratuito agora. Use conta gratuita, escolha Qwen3.7-Max-Preview ou Qwen3.7-Plus-Preview e avalie o modelo com prompts reais.
Arenas públicas são úteis para comparação. Elas não substituem API, mas ajudam a comparar respostas sem cadastro.
Você não pode rodar Qwen 3.7 localmente. Nenhum peso do Qwen 3.7 foi publicado.
Não há camada gratuita de API em agregadores. OpenRouter e similares ainda não listam Qwen 3.7.
Créditos da Alibaba Cloud são teste, não gratuidade permanente. Use para validar integração, mas acompanhe custos.

Quando a API do Qwen 3.7 estiver totalmente pública, as opções devem aumentar. Até lá, comece pelo Qwen Chat. Se for avançar para API, teste as chamadas no Apidog: envie a requisição, inspecione a resposta, salve como caso reutilizável e gere documentação para sua equipe. Você também pode baixar o Apidog gratuitamente.

DEV Community

Como Usar Qwen 3.7 Grátis?

TL;DR

O que o Qwen 3.7 é

Caminho 1: Qwen Chat

Como usar

O que dá para testar

Limites

Quando usar

Caminho 2: arenas públicas de modelos

Como testar

Bons prompts para comparar modelos

Limites

Quando usar

Caminho 3: execução local com Ollama ou LM Studio

Por que não funciona

O que usar localmente hoje

Quando usar

Caminho 4: agregadores de API

Estado atual

O que dá para fazer agora

Atenção com camadas gratuitas

Quando usar

Caminho 5: créditos gratuitos da Alibaba Cloud

O que são esses créditos

Como usar de forma segura

Quando usar

Comparação dos caminhos gratuitos do Qwen 3.7

Decisão rápida

Conclusão

Top comments (0)