Lucas

Posted on Jun 3 • Originally published at apidog.com

Como usar a API Qwen 3.7 Plus?

Qwen 3.7 Plus é o modelo de agente multimodal da Alibaba para entradas de texto, imagem e vídeo. Ele oferece contexto de 1M de tokens e preço baixo, mas é entregue apenas via API. Na prática, você precisa resolver três pontos: obter uma chave, montar payloads multimodais corretamente e estimar o custo por chamada.

Experimente o Apidog hoje

Neste guia, você verá como acessar o Qwen 3.7 Plus, gerar uma chave no Alibaba Cloud Model Studio, fazer a primeira requisição em Python, curl e JavaScript, enviar imagens e vídeos, calcular custos aproximados e lidar com limites de taxa. Também usaremos o Apidog para testar requisições, inspecionar respostas JSON e simular endpoints durante o desenvolvimento.

Se você quiser revisar capacidades e benchmarks antes da implementação, veja a visão geral do Qwen 3.7 Plus. Para o modelo de texto, consulte o guia da API base do Qwen 3.7.

TL;DR

O Qwen 3.7 Plus roda no Alibaba Cloud Model Studio, também conhecido como DashScope, por meio de um endpoint compatível com OpenAI.

Você define uma URL base por região, passa sua chave como token Bearer e chama:

/chat/completions

com o modelo:

qwen3.7-plus

Requisições multimodais usam partes de conteúdo com texto, imagem ou vídeo dentro de messages.

Preços informados:

Entrada: US$ 0,40 por 1M de tokens
Saída: US$ 1,60 por 1M de tokens
Entrada em cache: US$ 0,08 por 1M de tokens

Não há plano gratuito permanente, mas novas contas podem receber uma cota gratuita única. Tokens de imagem e vídeo entram no mesmo orçamento de contexto de 1M, então mídia visual aumenta o custo. Antes de produção, confirme o ID exato do modelo na documentação do Model Studio.

Como acessar o Qwen 3.7 Plus

O Plus é uma API comercial desde o início. Existem duas formas principais de uso.

1. Qwen Chat

Use chat.qwen.ai para testar o modelo manualmente.

Esse caminho é útil para:

validar respostas com imagens;
testar screenshots;
entender o comportamento do modelo;
experimentar prompts antes de codificar.

Não use essa interface para integração de aplicação.

2. Alibaba Cloud Model Studio / DashScope

Para integração real, use o Alibaba Cloud Model Studio. Ele expõe o Qwen 3.7 Plus em modo compatível com OpenAI.

Isso permite reaproveitar código existente que já usa o SDK da OpenAI, alterando apenas:

base_url;
chave de API;
ID do modelo.

Limitação importante: o Qwen 3.7 Plus é proprietário. Não há pesos abertos para download, então você não pode auto-hospedar o modelo nem executá-lo isoladamente. A visão geral do Qwen 3.7 Plus cobre essa limitação com mais contexto.

Método	Acesso à API	Custo	Melhor para
Qwen Chat (chat.qwen.ai)	Não	Gratuito, com limite de taxa	Avaliação rápida com imagens
Model Studio / DashScope	Sim, compatível com OpenAI	Pagamento por token	Integração em produção
Auto-hospedagem	Não	n/a	Não disponível; pesos são fechados

Como obter uma chave API do Qwen 3.7 Plus

O acesso é feito com uma conta Alibaba Cloud.

Passo a passo

Crie uma conta Alibaba Cloud.
Abra o console do Model Studio em modelstudio.console.alibabacloud.com.
Ative o Model Studio para sua conta e região.
Vá até a seção de chaves de API.
Gere uma nova chave.
Copie a chave uma única vez e armazene-a como segredo.

As chaves são restritas por região. Por exemplo, uma chave criada para Singapura não autentica contra o endpoint de Pequim.

URLs base por região

Região	URL base
Singapura	`https://dashscope-intl.aliyuncs.com/compatible-mode/v1`
EUA / Virgínia	`https://dashscope-us.aliyuncs.com/compatible-mode/v1`
Pequim / China	`https://dashscope.aliyuncs.com/compatible-mode/v1`

Configure a chave como variável de ambiente

Não coloque sua chave no código-fonte.

No macOS ou Linux:

export DASHSCOPE_API_KEY="sk-your-key-here"

No Windows PowerShell:

setx DASHSCOPE_API_KEY "sk-your-key-here"

Sua primeira requisição: Python, curl e JavaScript

O endpoint é compatível com OpenAI. Você pode usar o SDK oficial da OpenAI apontando para a URL base do DashScope, ou fazer chamadas HTTP diretamente.

O ID usado aqui é:

qwen3.7-plus

Antes de publicar em produção, confirme a string atual na lista de modelos do Model Studio, pois identificadores podem mudar.

Python com o SDK da OpenAI

Instale o SDK:

pip install openai

Faça uma chamada simples:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": "Resuma o modelo de preços do Qwen 3.7 Plus em duas frases."
        }
    ],
)

print(resp.choices[0].message.content)

curl

curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.7-plus",
    "messages": [
      {
        "role": "user",
        "content": "Hello from the Qwen 3.7 Plus API."
      }
    ]
  }'

JavaScript

Instale o SDK:

npm install openai

Use o endpoint compatível:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const resp = await client.chat.completions.create({
  model: "qwen3.7-plus",
  messages: [
    {
      role: "user",
      content: "Hello from the Qwen 3.7 Plus API.",
    },
  ],
});

console.log(resp.choices[0].message.content);

Enviando imagens e vídeo

O motivo principal para usar o Plus em vez do Max é a entrada multimodal.

Você envia mídia visual dentro do array content da mensagem. O formato é semelhante ao usado por APIs de visão compatíveis com OpenAI.

Exemplo com imagem via URL

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Qual botão envia este formulário? Retorne as coordenadas em pixels."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/screenshot.png"
                    }
                },
            ],
        }
    ],
)

print(resp.choices[0].message.content)

Exemplo com imagem em base64

import base64
import mimetypes
from pathlib import Path

def image_to_data_uri(path: str) -> str:
    file_path = Path(path)
    mime_type = mimetypes.guess_type(file_path)[0] or "image/png"

    encoded = base64.b64encode(file_path.read_bytes()).decode("utf-8")
    return f"data:{mime_type};base64,{encoded}"

image_uri = image_to_data_uri("screenshot.png")

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Descreva os principais elementos visuais desta tela."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": image_uri
                    }
                },
            ],
        }
    ],
)

print(resp.choices[0].message.content)

Você pode usar esse padrão para cenários como:

análise de screenshots;
agentes de GUI;
extração de dados visuais;
revisão de layouts;
interpretação de diagramas;
identificação de botões e ações em uma interface.

O vídeo segue o mesmo princípio, com partes de vídeo no conteúdo da mensagem. Os nomes exatos dos campos podem variar por região e versão da API, então valide o esquema atual na documentação de compatibilidade com OpenAI.

Preços

O Qwen 3.7 Plus é posicionado como um modelo multimodal econômico.

Modelo	Entrada / 1M	Saída / 1M	Entrada em cache / 1M
Qwen 3.7 Plus	US$ 0,40	US$ 1,60	US$ 0,08
Qwen 3.7 Max	US$ 2,50	US$ 7,50	US$ 0,25

Na entrada, o Plus é aproximadamente seis vezes mais barato que o Max.

Não há nível gratuito permanente. Novas contas do Model Studio podem receber uma cota gratuita única de tokens para avaliação, geralmente na região de Singapura. Depois disso, a cobrança muda para pay-as-you-go.

O caminho gratuito antigo via Qwen OAuth foi desativado em 15 de abril de 2026, então não baseie sua integração nele.

Consulte os números oficiais na página de preços do Model Studio e no guia de cota gratuita. Para formas sem custo de experimentar a família Qwen, veja o guia Qwen 3.7 gratuito.

Quanto as requisições realmente custam

Texto tende a ser barato. Imagens e vídeos aumentam a conta porque são convertidos em tokens de entrada.

Esses tokens compartilham:

a mesma taxa por token;
o mesmo contexto de 1M;
o mesmo orçamento da requisição.

Requisição	Tokens de entrada	Tokens de saída	Custo aprox.
Prompt apenas de texto	10.000	2.000	~US$ 0,007
Uma captura de tela 1080p + prompt	~1.500	300	~US$ 0,001
Vídeo de 30s amostrado a 2 fps	~77.000	500	~US$ 0,032

Os tokens por quadro dependem de resolução, compressão, duração e taxa de amostragem. Ainda assim, a regra prática é simples:

agente de texto no Plus custa muito pouco;
screenshot ocasional continua barato;
fluxo pesado de vídeo pode multiplicar o custo por chamada.

Para controlar custos:

Reduza a resolução das imagens antes de enviar.
Recorte a região relevante da screenshot.
Faça amostragem de vídeo com poucos frames por segundo.
Evite reenviar o mesmo contexto visual quando não for necessário.
Use cache de entrada quando o cenário permitir.

Para uma estratégia mais ampla, veja as notas sobre como reduzir os custos de token do agente e a análise sobre a guerra de preços chinesa de LLMs de 2026.

Limites de taxa e erros

O Model Studio aplica limites por conta em:

requisições por minuto;
tokens por minuto;
região;
nível da conta.

Não há um único número universal. Verifique a página de cotas no console do Model Studio para saber seus limites atuais. Se você atingir o teto, solicite aumento pelo próprio console.

Erros comuns

Erro	Causa provável	Ação
`401 Unauthorized`	Chave inválida ou chave de outra região	Verifique `DASHSCOPE_API_KEY` e URL base
`429 Too Many Requests`	Limite de taxa excedido	Use retry com backoff exponencial
`400 Bad Request`	Payload inválido, imagem grande ou estouro de contexto	Valide o JSON e reduza mídia/contexto
`5xx`	Falha temporária do serviço	Tente novamente com backoff

Retry básico em Python

import time
from openai import OpenAI
from openai import RateLimitError, APIError

def call_with_retry(client: OpenAI, payload: dict, max_retries: int = 5):
    for attempt in range(max_retries):
        try:
            return client.chat.completions.create(**payload)
        except (RateLimitError, APIError) as e:
            if attempt == max_retries - 1:
                raise

            sleep_seconds = 2 ** attempt
            print(f"Erro temporário: {e}. Tentando novamente em {sleep_seconds}s...")
            time.sleep(sleep_seconds)

payload = {
    "model": "qwen3.7-plus",
    "messages": [
        {
            "role": "user",
            "content": "Explique o que é backoff exponencial."
        }
    ],
}

resp = call_with_retry(client, payload)
print(resp.choices[0].message.content)

Teste e simule a API com Apidog

Requisições multimodais são fáceis de quebrar. Você precisa lidar com:

imagens em base64;
arrays aninhados em content;
payloads grandes;
respostas JSON;
chamadas de ferramentas;
diferentes ambientes e chaves;
mocks para frontend.

O Apidog ajuda a testar esse fluxo sem depender apenas do terminal.

Você pode:

Criar uma requisição para /chat/completions.
Configurar a URL base do DashScope por ambiente.
Salvar a chave do Model Studio como variável segura.
Enviar payloads com texto, imagem ou vídeo.
Inspecionar a resposta JSON bruta.
Criar mocks do endpoint para o frontend.
Depurar fluxos com chamadas de ferramenta.

Quando o Plus encadeia chamadas em um agente de GUI ou CLI, o depurador de agente de IA do Apidog mostra a sequência completa para ajudar a localizar onde a execução falhou.

Baixe o Apidog para testar, depurar e simular a API do Qwen 3.7 Plus antes de conectá-la à produção.

Perguntas Frequentes

Existe um nível gratuito para a API Qwen 3.7 Plus?

Não há nível gratuito permanente. Novas contas do Alibaba Cloud Model Studio podem receber uma cota gratuita única de tokens para avaliação, geralmente na região de Singapura. Depois disso, a cobrança passa a ser por uso.

Qual é o ID do modelo?

O ID usado no Model Studio é:

qwen3.7-plus

Como identificadores podem mudar, confirme a string atual na lista de modelos do Model Studio antes de implantar.

Como o custo de imagem e vídeo é calculado?

Conteúdo visual é convertido em tokens de entrada e cobrado na taxa padrão de entrada. Uma screenshot 1080p pode representar alguns milhares de tokens. Vídeos adicionam tokens por frame amostrado, então payloads grandes de mídia tendem a dominar o custo.

Como a API difere do Qwen 3.7 Max?

Ambos usam formato compatível com OpenAI e URLs base semelhantes. O Plus aceita partes de imagem e vídeo no conteúdo da mensagem e custa cerca de seis vezes menos na entrada. O Max é focado em texto e mantém vantagem em alguns benchmarks de texto puro.

Posso auto-hospedar o Qwen 3.7 Plus?

Não. Os pesos são fechados. O modelo roda apenas via Alibaba Cloud Model Studio.

Qual URL base devo usar?

Use a URL base que corresponde à região onde você criou sua chave:

Singapura: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
EUA / Virgínia: https://dashscope-us.aliyuncs.com/compatible-mode/v1
Pequim / China: https://dashscope.aliyuncs.com/compatible-mode/v1

Uma chave de uma região não autentica contra o endpoint de outra.

Conclusão

Integrar o Qwen 3.7 Plus é basicamente trocar a URL base e a chave no SDK da OpenAI, depois adicionar partes de imagem ou vídeo quando precisar de entrada multimodal.

O custo é baixo para texto e cresce conforme o volume visual enviado. A implementação deve focar em três práticas: validar payloads, controlar tamanho de mídia e testar o fluxo completo antes de produção.

Comece obtendo uma chave no Model Studio, envie uma primeira requisição multimodal e use o Apidog para depurar, documentar e simular a API durante o desenvolvimento.

DEV Community