Qwen 3.7 Plus é o modelo de agente multimodal da Alibaba para entradas de texto, imagem e vídeo. Ele oferece contexto de 1M de tokens e preço baixo, mas é entregue apenas via API. Na prática, você precisa resolver três pontos: obter uma chave, montar payloads multimodais corretamente e estimar o custo por chamada.
Neste guia, você verá como acessar o Qwen 3.7 Plus, gerar uma chave no Alibaba Cloud Model Studio, fazer a primeira requisição em Python, curl e JavaScript, enviar imagens e vídeos, calcular custos aproximados e lidar com limites de taxa. Também usaremos o Apidog para testar requisições, inspecionar respostas JSON e simular endpoints durante o desenvolvimento.
Se você quiser revisar capacidades e benchmarks antes da implementação, veja a visão geral do Qwen 3.7 Plus. Para o modelo de texto, consulte o guia da API base do Qwen 3.7.
TL;DR
O Qwen 3.7 Plus roda no Alibaba Cloud Model Studio, também conhecido como DashScope, por meio de um endpoint compatível com OpenAI.
Você define uma URL base por região, passa sua chave como token Bearer e chama:
/chat/completions
com o modelo:
qwen3.7-plus
Requisições multimodais usam partes de conteúdo com texto, imagem ou vídeo dentro de messages.
Preços informados:
- Entrada: US$ 0,40 por 1M de tokens
- Saída: US$ 1,60 por 1M de tokens
- Entrada em cache: US$ 0,08 por 1M de tokens
Não há plano gratuito permanente, mas novas contas podem receber uma cota gratuita única. Tokens de imagem e vídeo entram no mesmo orçamento de contexto de 1M, então mídia visual aumenta o custo. Antes de produção, confirme o ID exato do modelo na documentação do Model Studio.
Como acessar o Qwen 3.7 Plus
O Plus é uma API comercial desde o início. Existem duas formas principais de uso.
1. Qwen Chat
Use chat.qwen.ai para testar o modelo manualmente.
Esse caminho é útil para:
- validar respostas com imagens;
- testar screenshots;
- entender o comportamento do modelo;
- experimentar prompts antes de codificar.
Não use essa interface para integração de aplicação.
2. Alibaba Cloud Model Studio / DashScope
Para integração real, use o Alibaba Cloud Model Studio. Ele expõe o Qwen 3.7 Plus em modo compatível com OpenAI.
Isso permite reaproveitar código existente que já usa o SDK da OpenAI, alterando apenas:
-
base_url; - chave de API;
- ID do modelo.
Limitação importante: o Qwen 3.7 Plus é proprietário. Não há pesos abertos para download, então você não pode auto-hospedar o modelo nem executá-lo isoladamente. A visão geral do Qwen 3.7 Plus cobre essa limitação com mais contexto.
| Método | Acesso à API | Custo | Melhor para |
|---|---|---|---|
| Qwen Chat (chat.qwen.ai) | Não | Gratuito, com limite de taxa | Avaliação rápida com imagens |
| Model Studio / DashScope | Sim, compatível com OpenAI | Pagamento por token | Integração em produção |
| Auto-hospedagem | Não | n/a | Não disponível; pesos são fechados |
Como obter uma chave API do Qwen 3.7 Plus
O acesso é feito com uma conta Alibaba Cloud.
Passo a passo
- Crie uma conta Alibaba Cloud.
- Abra o console do Model Studio em
modelstudio.console.alibabacloud.com. - Ative o Model Studio para sua conta e região.
- Vá até a seção de chaves de API.
- Gere uma nova chave.
- Copie a chave uma única vez e armazene-a como segredo.
As chaves são restritas por região. Por exemplo, uma chave criada para Singapura não autentica contra o endpoint de Pequim.
URLs base por região
| Região | URL base |
|---|---|
| Singapura | https://dashscope-intl.aliyuncs.com/compatible-mode/v1 |
| EUA / Virgínia | https://dashscope-us.aliyuncs.com/compatible-mode/v1 |
| Pequim / China | https://dashscope.aliyuncs.com/compatible-mode/v1 |
Configure a chave como variável de ambiente
Não coloque sua chave no código-fonte.
No macOS ou Linux:
export DASHSCOPE_API_KEY="sk-your-key-here"
No Windows PowerShell:
setx DASHSCOPE_API_KEY "sk-your-key-here"
Sua primeira requisição: Python, curl e JavaScript
O endpoint é compatível com OpenAI. Você pode usar o SDK oficial da OpenAI apontando para a URL base do DashScope, ou fazer chamadas HTTP diretamente.
O ID usado aqui é:
qwen3.7-plus
Antes de publicar em produção, confirme a string atual na lista de modelos do Model Studio, pois identificadores podem mudar.
Python com o SDK da OpenAI
Instale o SDK:
pip install openai
Faça uma chamada simples:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DASHSCOPE_API_KEY"],
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": "Resuma o modelo de preços do Qwen 3.7 Plus em duas frases."
}
],
)
print(resp.choices[0].message.content)
curl
curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "Hello from the Qwen 3.7 Plus API."
}
]
}'
JavaScript
Instale o SDK:
npm install openai
Use o endpoint compatível:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});
const resp = await client.chat.completions.create({
model: "qwen3.7-plus",
messages: [
{
role: "user",
content: "Hello from the Qwen 3.7 Plus API.",
},
],
});
console.log(resp.choices[0].message.content);
Enviando imagens e vídeo
O motivo principal para usar o Plus em vez do Max é a entrada multimodal.
Você envia mídia visual dentro do array content da mensagem. O formato é semelhante ao usado por APIs de visão compatíveis com OpenAI.
Exemplo com imagem via URL
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Qual botão envia este formulário? Retorne as coordenadas em pixels."
},
{
"type": "image_url",
"image_url": {
"url": "https://example.com/screenshot.png"
}
},
],
}
],
)
print(resp.choices[0].message.content)
Exemplo com imagem em base64
import base64
import mimetypes
from pathlib import Path
def image_to_data_uri(path: str) -> str:
file_path = Path(path)
mime_type = mimetypes.guess_type(file_path)[0] or "image/png"
encoded = base64.b64encode(file_path.read_bytes()).decode("utf-8")
return f"data:{mime_type};base64,{encoded}"
image_uri = image_to_data_uri("screenshot.png")
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Descreva os principais elementos visuais desta tela."
},
{
"type": "image_url",
"image_url": {
"url": image_uri
}
},
],
}
],
)
print(resp.choices[0].message.content)
Você pode usar esse padrão para cenários como:
- análise de screenshots;
- agentes de GUI;
- extração de dados visuais;
- revisão de layouts;
- interpretação de diagramas;
- identificação de botões e ações em uma interface.
O vídeo segue o mesmo princípio, com partes de vídeo no conteúdo da mensagem. Os nomes exatos dos campos podem variar por região e versão da API, então valide o esquema atual na documentação de compatibilidade com OpenAI.
Preços
O Qwen 3.7 Plus é posicionado como um modelo multimodal econômico.
| Modelo | Entrada / 1M | Saída / 1M | Entrada em cache / 1M |
|---|---|---|---|
| Qwen 3.7 Plus | US$ 0,40 | US$ 1,60 | US$ 0,08 |
| Qwen 3.7 Max | US$ 2,50 | US$ 7,50 | US$ 0,25 |
Na entrada, o Plus é aproximadamente seis vezes mais barato que o Max.
Não há nível gratuito permanente. Novas contas do Model Studio podem receber uma cota gratuita única de tokens para avaliação, geralmente na região de Singapura. Depois disso, a cobrança muda para pay-as-you-go.
O caminho gratuito antigo via Qwen OAuth foi desativado em 15 de abril de 2026, então não baseie sua integração nele.
Consulte os números oficiais na página de preços do Model Studio e no guia de cota gratuita. Para formas sem custo de experimentar a família Qwen, veja o guia Qwen 3.7 gratuito.
Quanto as requisições realmente custam
Texto tende a ser barato. Imagens e vídeos aumentam a conta porque são convertidos em tokens de entrada.
Esses tokens compartilham:
- a mesma taxa por token;
- o mesmo contexto de 1M;
- o mesmo orçamento da requisição.
| Requisição | Tokens de entrada | Tokens de saída | Custo aprox. |
|---|---|---|---|
| Prompt apenas de texto | 10.000 | 2.000 | ~US$ 0,007 |
| Uma captura de tela 1080p + prompt | ~1.500 | 300 | ~US$ 0,001 |
| Vídeo de 30s amostrado a 2 fps | ~77.000 | 500 | ~US$ 0,032 |
Os tokens por quadro dependem de resolução, compressão, duração e taxa de amostragem. Ainda assim, a regra prática é simples:
- agente de texto no Plus custa muito pouco;
- screenshot ocasional continua barato;
- fluxo pesado de vídeo pode multiplicar o custo por chamada.
Para controlar custos:
- Reduza a resolução das imagens antes de enviar.
- Recorte a região relevante da screenshot.
- Faça amostragem de vídeo com poucos frames por segundo.
- Evite reenviar o mesmo contexto visual quando não for necessário.
- Use cache de entrada quando o cenário permitir.
Para uma estratégia mais ampla, veja as notas sobre como reduzir os custos de token do agente e a análise sobre a guerra de preços chinesa de LLMs de 2026.
Limites de taxa e erros
O Model Studio aplica limites por conta em:
- requisições por minuto;
- tokens por minuto;
- região;
- nível da conta.
Não há um único número universal. Verifique a página de cotas no console do Model Studio para saber seus limites atuais. Se você atingir o teto, solicite aumento pelo próprio console.
Erros comuns
| Erro | Causa provável | Ação |
|---|---|---|
401 Unauthorized |
Chave inválida ou chave de outra região | Verifique DASHSCOPE_API_KEY e URL base |
429 Too Many Requests |
Limite de taxa excedido | Use retry com backoff exponencial |
400 Bad Request |
Payload inválido, imagem grande ou estouro de contexto | Valide o JSON e reduza mídia/contexto |
5xx |
Falha temporária do serviço | Tente novamente com backoff |
Retry básico em Python
import time
from openai import OpenAI
from openai import RateLimitError, APIError
def call_with_retry(client: OpenAI, payload: dict, max_retries: int = 5):
for attempt in range(max_retries):
try:
return client.chat.completions.create(**payload)
except (RateLimitError, APIError) as e:
if attempt == max_retries - 1:
raise
sleep_seconds = 2 ** attempt
print(f"Erro temporário: {e}. Tentando novamente em {sleep_seconds}s...")
time.sleep(sleep_seconds)
payload = {
"model": "qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "Explique o que é backoff exponencial."
}
],
}
resp = call_with_retry(client, payload)
print(resp.choices[0].message.content)
Teste e simule a API com Apidog
Requisições multimodais são fáceis de quebrar. Você precisa lidar com:
- imagens em base64;
- arrays aninhados em
content; - payloads grandes;
- respostas JSON;
- chamadas de ferramentas;
- diferentes ambientes e chaves;
- mocks para frontend.
O Apidog ajuda a testar esse fluxo sem depender apenas do terminal.
Você pode:
- Criar uma requisição para
/chat/completions. - Configurar a URL base do DashScope por ambiente.
- Salvar a chave do Model Studio como variável segura.
- Enviar payloads com texto, imagem ou vídeo.
- Inspecionar a resposta JSON bruta.
- Criar mocks do endpoint para o frontend.
- Depurar fluxos com chamadas de ferramenta.
Quando o Plus encadeia chamadas em um agente de GUI ou CLI, o depurador de agente de IA do Apidog mostra a sequência completa para ajudar a localizar onde a execução falhou.
Baixe o Apidog para testar, depurar e simular a API do Qwen 3.7 Plus antes de conectá-la à produção.
Perguntas Frequentes
Existe um nível gratuito para a API Qwen 3.7 Plus?
Não há nível gratuito permanente. Novas contas do Alibaba Cloud Model Studio podem receber uma cota gratuita única de tokens para avaliação, geralmente na região de Singapura. Depois disso, a cobrança passa a ser por uso.
Qual é o ID do modelo?
O ID usado no Model Studio é:
qwen3.7-plus
Como identificadores podem mudar, confirme a string atual na lista de modelos do Model Studio antes de implantar.
Como o custo de imagem e vídeo é calculado?
Conteúdo visual é convertido em tokens de entrada e cobrado na taxa padrão de entrada. Uma screenshot 1080p pode representar alguns milhares de tokens. Vídeos adicionam tokens por frame amostrado, então payloads grandes de mídia tendem a dominar o custo.
Como a API difere do Qwen 3.7 Max?
Ambos usam formato compatível com OpenAI e URLs base semelhantes. O Plus aceita partes de imagem e vídeo no conteúdo da mensagem e custa cerca de seis vezes menos na entrada. O Max é focado em texto e mantém vantagem em alguns benchmarks de texto puro.
Posso auto-hospedar o Qwen 3.7 Plus?
Não. Os pesos são fechados. O modelo roda apenas via Alibaba Cloud Model Studio.
Qual URL base devo usar?
Use a URL base que corresponde à região onde você criou sua chave:
- Singapura:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1 - EUA / Virgínia:
https://dashscope-us.aliyuncs.com/compatible-mode/v1 - Pequim / China:
https://dashscope.aliyuncs.com/compatible-mode/v1
Uma chave de uma região não autentica contra o endpoint de outra.
Conclusão
Integrar o Qwen 3.7 Plus é basicamente trocar a URL base e a chave no SDK da OpenAI, depois adicionar partes de imagem ou vídeo quando precisar de entrada multimodal.
O custo é baixo para texto e cresce conforme o volume visual enviado. A implementação deve focar em três práticas: validar payloads, controlar tamanho de mídia e testar o fluxo completo antes de produção.
Comece obtendo uma chave no Model Studio, envie uma primeira requisição multimodal e use o Apidog para depurar, documentar e simular a API durante o desenvolvimento.


Top comments (0)