DEV Community

Cover image for Cómo usar la API de Qwen 3.7 Plus
Roobia
Roobia

Posted on • Originally published at apidog.com

Cómo usar la API de Qwen 3.7 Plus

Qwen 3.7 Plus es el modelo de agente multimodal de Alibaba: acepta texto, imagen y video como entrada, soporta un contexto de 1M de tokens y se ofrece a un precio bajo. Como solo está disponible mediante API, lo importante para un desarrollador es: cómo obtener una clave, cómo enviar una imagen y cómo estimar el costo de cada llamada.

Prueba Apidog hoy

En esta guía implementará el flujo completo: acceso a Model Studio, creación de la clave API, primera solicitud con Python, curl y JavaScript, formato de payload multimodal, cálculo de precios, límites de tasa y pruebas con Apidog. Si quiere revisar primero capacidades y benchmarks, consulte la descripción general de Qwen 3.7 Plus; para el modelo insignia solo de texto, vea la guía de la API base de Qwen 3.7.

En resumen

Qwen 3.7 Plus se ejecuta a través de Alibaba Cloud Model Studio, también conocido como DashScope, usando un endpoint compatible con OpenAI.

El flujo básico es:

  1. Crear una clave API en Alibaba Cloud Model Studio.
  2. Elegir la URL base de la región correcta.
  3. Enviar la clave como token Bearer.
  4. Llamar a /chat/completions.
  5. Usar el modelo qwen3.7-plus.
  6. Para entrada multimodal, agregar partes de imagen o video dentro del contenido del mensaje.

El precio indicado es de:

Tipo de token Precio
Entrada $0.40 / 1M tokens
Salida $1.60 / 1M tokens
Entrada en caché $0.08 / 1M tokens

No hay un nivel gratuito perpetuo, aunque las cuentas nuevas pueden recibir una cuota gratuita única. Los tokens de visión comparten el mismo presupuesto de contexto de 1M, por lo que imágenes y video aumentan el costo. Antes de producción, confirme siempre la ID exacta del modelo en la documentación de Model Studio.

Cómo acceder a Qwen 3.7 Plus

Qwen 3.7 Plus no se descarga ni se autoaloja. Es un modelo propietario disponible como servicio.

Qwen 3.7 Plus

Hay dos formas prácticas de interactuar con él.

1. Qwen Chat

chat.qwen.ai sirve para evaluación rápida.

Úselo si quiere:

  • Probar el modelo con una imagen.
  • Subir una captura de pantalla.
  • Validar si entiende una interfaz, documento o flujo visual.
  • Evaluar respuestas antes de escribir código.

No lo use para integración de producto, porque no es la API.

2. Alibaba Cloud Model Studio / DashScope

Model Studio es la superficie real de API. Expone Qwen 3.7 Plus mediante un endpoint compatible con OpenAI, así que puede reutilizar gran parte del código existente si ya usa el SDK de OpenAI.

Método Acceso a la API Costo Mejor para
Qwen Chat (chat.qwen.ai) No Gratis, con límites de tasa Evaluación rápida con imágenes
Model Studio / DashScope Sí, compatible con OpenAI Pago por token Integración en producción
Autoalojamiento No n/a No disponible; los pesos son cerrados

Si necesita ejecutar el modelo en infraestructura propia, Qwen 3.7 Plus no es la opción adecuada. Para más contexto sobre esa limitación, consulte la descripción general de Qwen 3.7 Plus.

Obtención de una clave API de Qwen 3.7 Plus

El acceso se gestiona desde una cuenta de Alibaba Cloud.

Pasos:

  1. Cree una cuenta de Alibaba Cloud.
  2. Abra la consola de Model Studio: modelstudio.console.alibabacloud.com.
  3. Active Model Studio para su cuenta y región.
  4. Vaya a la sección de claves API.
  5. Genere una clave nueva.
  6. Copie la clave y guárdela como un secreto.

La clave suele tener formato similar a:

sk-...
Enter fullscreen mode Exit fullscreen mode

Las claves están asociadas a una región. Una clave creada para Singapur no autenticará contra el endpoint de Beijing.

URLs base por región

Región URL base
Singapur https://dashscope-intl.aliyuncs.com/compatible-mode/v1
EE. UU. / Virginia https://dashscope-us.aliyuncs.com/compatible-mode/v1
Beijing / China https://dashscope.aliyuncs.com/compatible-mode/v1

Guarde la clave como variable de entorno y no la suba al repositorio.

# macOS / Linux
export DASHSCOPE_API_KEY="sk-su-clave-aquí"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-su-clave-aquí"
Enter fullscreen mode Exit fullscreen mode

Primera solicitud: Python, curl y JavaScript

El endpoint principal es:

POST /chat/completions
Enter fullscreen mode Exit fullscreen mode

La forma completa para Singapur sería:

https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions
Enter fullscreen mode Exit fullscreen mode

La ID del modelo es qwen3.7-plus, pero confirme la cadena actual en la lista de modelos de Model Studio antes de implementarlo.

Python con el SDK de OpenAI

Instale el SDK:

pip install openai
Enter fullscreen mode Exit fullscreen mode

Código mínimo:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": "Resume el modelo de precios de Qwen 3.7 Plus en dos oraciones."
        }
    ],
)

print(resp.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

curl

curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.7-plus",
    "messages": [
      {
        "role": "user",
        "content": "Hola desde la API de Qwen 3.7 Plus."
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

JavaScript

Instale el SDK:

npm install openai
Enter fullscreen mode Exit fullscreen mode

Código:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const resp = await client.chat.completions.create({
  model: "qwen3.7-plus",
  messages: [
    {
      role: "user",
      content: "Hola desde la API de Qwen 3.7 Plus.",
    },
  ],
});

console.log(resp.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Envío de imágenes y video

La razón principal para usar Qwen 3.7 Plus en lugar de Qwen 3.7 Max es la entrada multimodal.

Para enviar una imagen, use un array content dentro del mensaje. Ese array combina texto y partes visuales.

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "¿Qué botón envía este formulario? Proporcione las coordenadas de los píxeles."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/screenshot.png"
                    }
                },
            ],
        }
    ],
)

print(resp.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Puede pasar la imagen como:

  • URL pública.
  • URI de datos en base64.

Ejemplo conceptual con base64:

{
  "type": "image_url",
  "image_url": {
    "url": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUg..."
  }
}
Enter fullscreen mode Exit fullscreen mode

Este formato permite construir agentes que razonan sobre interfaces. Por ejemplo, puede enviar una captura de pantalla y pedir una acción estructurada:

Analiza la captura. Devuelve la siguiente acción como JSON:
{
  "action": "click",
  "x": número,
  "y": número,
  "reason": "motivo"
}
Enter fullscreen mode Exit fullscreen mode

Una respuesta esperada podría ser:

{
  "action": "click",
  "x": 487,
  "y": 232,
  "reason": "El botón Enviar está ubicado en la parte inferior derecha del formulario."
}
Enter fullscreen mode Exit fullscreen mode

El video sigue el mismo patrón general con una parte de video, pero los nombres exactos de campos pueden variar por región. Consulte la documentación de compatibilidad con OpenAI para validar el esquema vigente.

Precios

Qwen 3.7 Plus está posicionado como un modelo multimodal económico.

Modelo Entrada / 1M Salida / 1M Entrada en caché / 1M
Qwen 3.7 Plus $0.40 $1.60 $0.08
Qwen 3.7 Max $2.50 $7.50 $0.25

En entrada, Plus es aproximadamente seis veces más barato que Max.

No hay un nivel gratuito perpetuo. Las cuentas nuevas de Model Studio pueden recibir una cuota gratuita única, normalmente en la región de Singapur, para evaluar el modelo antes de pasar a pago por uso.

La antigua ruta gratuita de Qwen OAuth fue retirada el 15 de abril de 2026, así que no construya dependencias sobre ella.

Referencias oficiales:

Para opciones de prueba sin costo en la familia Qwen, consulte la guía de Qwen 3.7 gratis.

Cómo estimar el costo real de una solicitud

El costo se calcula con esta fórmula:

costo = tokens_entrada * precio_entrada + tokens_salida * precio_salida
Enter fullscreen mode Exit fullscreen mode

Usando precios por millón:

costo = (tokens_entrada / 1_000_000 * 0.40) + (tokens_salida / 1_000_000 * 1.60)
Enter fullscreen mode Exit fullscreen mode

Ejemplos aproximados:

Solicitud Tokens de entrada Tokens de salida Costo aproximado
Prompt solo de texto 10,000 2,000 ~$0.007
Una captura de pantalla de 1080p + prompt ~1,500 300 ~$0.001
Video de 30s muestreado a 2 fps ~77,000 500 ~$0.032

Las cifras de tokens visuales dependen de resolución, compresión y muestreo. La regla práctica es simple:

  • Texto: barato.
  • Una imagen: normalmente manejable.
  • Video: puede crecer rápido.
  • Varias capturas de alta resolución: optimice antes de enviar.

Para reducir costos:

  1. Reduzca la resolución de capturas de pantalla.
  2. Recorte regiones irrelevantes de la imagen.
  3. Muestree menos fotogramas de video.
  4. Reutilice contexto cuando sea posible.
  5. Evite enviar imágenes repetidas si no cambian.
  6. Limite el tamaño máximo de salida con parámetros como max_tokens, si están disponibles en su configuración.

Para estrategias más amplias, revise las notas sobre reducción de los costos de tokens del agente y la guerra de precios de LLM chinos de 2026.

Límites de tasa y errores

Model Studio aplica límites por cuenta en:

  • Solicitudes por minuto.
  • Tokens por minuto.
  • Región.
  • Nivel de cuenta.

No hay un único límite universal publicado para todos los usuarios. Revise la página de cuota en la consola de Model Studio y solicite aumento allí si lo necesita.

Errores comunes

Código Causa probable Acción
401 Unauthorized Clave incorrecta o región equivocada Verifique DASHSCOPE_API_KEY y URL base
429 Too Many Requests Límite de tasa alcanzado Use reintentos con retroceso exponencial
400 Bad Request Payload malformado, imagen excesiva o contexto excedido Valide esquema, tamaño y tokens
5xx Error temporal del servicio Reintente con backoff

Ejemplo simple de retry en Python:

import time
from openai import OpenAI

def call_with_retry(client: OpenAI, payload: dict, retries: int = 3):
    for attempt in range(retries):
        try:
            return client.chat.completions.create(**payload)
        except Exception as exc:
            if attempt == retries - 1:
                raise

            sleep_seconds = 2 ** attempt
            print(f"Error temporal: {exc}. Reintentando en {sleep_seconds}s...")
            time.sleep(sleep_seconds)
Enter fullscreen mode Exit fullscreen mode

Úselo así:

payload = {
    "model": "qwen3.7-plus",
    "messages": [
        {
            "role": "user",
            "content": "Hola desde Qwen 3.7 Plus."
        }
    ],
}

resp = call_with_retry(client, payload)
print(resp.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Pruebe y simule la API con Apidog

Las solicitudes multimodales son fáciles de romper: imágenes en base64, arrays anidados, respuestas JSON estructuradas, llamadas a herramientas y flujos de agente. Probar todo desde la terminal se vuelve lento.

Apidog

Apidog permite probar este flujo en un espacio de trabajo visual:

  1. Cree una solicitud POST.
  2. Use la URL de DashScope correspondiente a su región.
  3. Configure el header Authorization: Bearer {{DASHSCOPE_API_KEY}}.
  4. Guarde la clave como variable de entorno.
  5. Envíe payloads con texto, imagen o video.
  6. Inspeccione la respuesta JSON sin procesar.
  7. Simule el endpoint para que frontend y backend puedan avanzar aunque el prompt todavía esté cambiando.

Ejemplo de body para probar en Apidog:

{
  "model": "qwen3.7-plus",
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "Analiza esta pantalla y devuelve la acción principal en JSON."
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://example.com/screenshot.png"
          }
        }
      ]
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode

Cuando Qwen 3.7 Plus participa en flujos de agente GUI o CLI, el depurador de agentes de IA de Apidog ayuda a revisar la secuencia completa de llamadas para encontrar dónde falló una ejecución.

También puede descargar Apidog para probar, depurar y simular la API de Qwen 3.7 Plus antes de llevarla a producción.

Preguntas frecuentes

¿Existe un nivel gratuito para la API de Qwen 3.7 Plus?

No hay un nivel gratuito perpetuo. Las nuevas cuentas de Alibaba Cloud Model Studio pueden recibir una cuota de tokens gratuita única para evaluación, normalmente en la región de Singapur. Después, la facturación pasa a pago por uso.

¿Cuál es la ID del modelo?

La ID indicada es:

qwen3.7-plus
Enter fullscreen mode Exit fullscreen mode

Confirme siempre la cadena vigente en la lista de modelos de Model Studio antes de implementarla, porque los identificadores pueden cambiar.

¿Cómo se calcula el costo de imagen y video?

El contenido visual se convierte en tokens de entrada. Esos tokens se facturan con la tarifa estándar de entrada.

Una captura de pantalla de 1080p puede representar unos pocos miles de tokens. El video agrega tokens por cada fotograma muestreado, por lo que las cargas con mucho video suelen dominar la factura.

¿En qué se diferencia de Qwen 3.7 Max?

Ambos usan una forma compatible con OpenAI y URLs base similares. La diferencia principal es:

  • Qwen 3.7 Plus acepta imagen y video.
  • Qwen 3.7 Max es solo texto.
  • Plus cuesta aproximadamente seis veces menos en entrada.
  • Max mantiene una pequeña ventaja en benchmarks de solo texto.

¿Puedo autoalojar Qwen 3.7 Plus?

No. Los pesos son cerrados. Qwen 3.7 Plus solo se ejecuta a través de Alibaba Cloud Model Studio.

¿Qué URL base debo usar?

Use la URL que coincida con la región donde creó su clave:

Región URL base
Singapur https://dashscope-intl.aliyuncs.com/compatible-mode/v1
EE. UU. / Virginia https://dashscope-us.aliyuncs.com/compatible-mode/v1
Beijing / China https://dashscope.aliyuncs.com/compatible-mode/v1

Una clave de una región no autenticará contra el endpoint de otra.

En resumen

Llamar a Qwen 3.7 Plus es principalmente un cambio de URL base y clave en el SDK de OpenAI. Para multimodalidad, agregue partes de imagen o video dentro del array content.

La implementación mínima es:

  1. Crear una clave en Model Studio.
  2. Configurar DASHSCOPE_API_KEY.
  3. Elegir la URL base correcta.
  4. Enviar una solicitud a /chat/completions.
  5. Optimizar imágenes y video para controlar tokens.
  6. Probar el flujo completo en Apidog antes de producción.

El texto cuesta muy poco; la disciplina de costos está en cuántos píxeles y fotogramas envía al modelo.

Top comments (0)