Antoine Laurent

Posted on Jun 3 • Originally published at apidog.com

Comment utiliser l'API Qwen 3.7 Plus

Qwen 3.7 Plus est le modèle d’agent multimodal d’Alibaba : texte, image et vidéo en entrée, contexte de 1 million de jetons et tarification abordable. Comme il est disponible uniquement via API, les points à maîtriser sont simples : obtenir une clé, envoyer une requête multimodale et estimer le coût par appel.

Essayez Apidog aujourd’hui

Dans ce guide, vous allez configurer l’accès via Alibaba Cloud Model Studio, exécuter une première requête en Python, curl et JavaScript, envoyer une image, comprendre la charge utile multimodale, estimer les coûts et gérer les erreurs courantes. Vous pouvez aussi utiliser Apidog pour tester les requêtes, inspecter le JSON brut et simuler le point d’accès pendant le développement. Pour les capacités et benchmarks, consultez l’aperçu de Qwen 3.7 Plus. Pour le modèle textuel uniquement, voir le guide de l’API Qwen 3.7 de base.

TL;DR

Qwen 3.7 Plus s’utilise via Alibaba Cloud Model Studio, aussi appelé DashScope, avec un point d’accès compatible OpenAI. Vous définissez une URL de base régionale, transmettez votre clé API comme jeton Bearer, puis appelez /chat/completions avec le modèle qwen3.7-plus.

Les requêtes multimodales ajoutent des parties image_url ou vidéo dans le contenu du message. La tarification indiquée est de 0,40 $ par million de jetons d’entrée, 1,60 $ par million de jetons de sortie et 0,08 $ par million de jetons d’entrée mis en cache. Les images et vidéos consomment le même budget de contexte que le texte. Avant déploiement, confirmez toujours l’ID exact du modèle dans la documentation Model Studio.

Comment accéder à Qwen 3.7 Plus

Qwen 3.7 Plus est accessible de deux façons : via l’interface de test Qwen Chat ou via l’API commerciale Model Studio.

Option 1 : Qwen Chat

chat.qwen.ai permet de tester rapidement le modèle avec une image. Connectez-vous, choisissez le modèle Plus, importez une capture d’écran, puis observez la réponse.

À utiliser pour :

évaluer rapidement le comportement multimodal ;
tester une capture d’écran ou une image ;
comparer des prompts.

À éviter pour :

intégrer le modèle dans une application ;
automatiser des appels ;
mesurer précisément les coûts API.

Option 2 : Alibaba Cloud Model Studio

Model Studio, via DashScope, est l’option à utiliser pour une intégration réelle. L’API est compatible OpenAI : si votre code utilise déjà le SDK OpenAI, vous changez principalement deux paramètres :

base_url ou baseURL ;
api_key.

Qwen 3.7 Plus reste un modèle propriétaire. Il n’existe pas de poids ouverts à télécharger, donc vous ne pouvez pas l’auto-héberger ni l’exécuter en environnement isolé. Pour les compromis liés à ce choix, consultez l’aperçu de Qwen 3.7 Plus.

Méthode	Accès API	Coût	Idéal pour
Qwen Chat (chat.qwen.ai)	Non	Gratuit, limité en débit	Évaluation rapide avec des images
Model Studio (DashScope)	Oui, compatible OpenAI	Paiement par jeton	Intégration en production
Auto-hébergement	Non	n/a	Non disponible ; les poids sont fermés

Obtenir une clé API Qwen 3.7 Plus

L’accès API passe par un compte Alibaba Cloud.

Procédure :

Créez un compte Alibaba Cloud.
Ouvrez la console Model Studio : modelstudio.console.alibabacloud.com.
Activez Model Studio pour votre compte et votre région.
Ouvrez la section des clés API.
Générez une clé.
Copiez-la immédiatement et stockez-la comme un secret.

Les clés sont liées à une région. Une clé créée pour Singapour ne fonctionnera pas avec l’URL de base de Pékin.

Choisir l’URL de base

Région	URL de base
Singapour	`https://dashscope-intl.aliyuncs.com/compatible-mode/v1`
États-Unis (Virginie)	`https://dashscope-us.aliyuncs.com/compatible-mode/v1`
Pékin (Chine)	`https://dashscope.aliyuncs.com/compatible-mode/v1`

Stocker la clé en variable d’environnement

Ne mettez jamais la clé dans votre code source.

# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"

Dans un projet Node.js ou Python, vous pouvez ensuite lire cette variable depuis process.env ou os.environ.

Première requête avec Python, curl et JavaScript

Le point d’accès est compatible OpenAI. Vous pouvez donc utiliser le SDK OpenAI officiel ou appeler directement l’API HTTP.

L’ID de modèle utilisé ici est :

qwen3.7-plus

Avant un déploiement en production, confirmez la chaîne actuelle dans la liste des modèles de Model Studio, car les identifiants peuvent évoluer.

Exemple Python avec le SDK OpenAI

Installez le SDK :

pip install openai

Puis envoyez une requête texte simple :

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": "Résumez le modèle de tarification de Qwen 3.7 Plus en deux phrases."
        }
    ],
)

print(resp.choices[0].message.content)

À adapter selon votre région :

base_url="https://dashscope-us.aliyuncs.com/compatible-mode/v1"

ou :

base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"

Exemple curl

curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.7-plus",
    "messages": [
      {
        "role": "user",
        "content": "Bonjour depuis l'\''API Qwen 3.7 Plus."
      }
    ]
  }'

Utilisez curl pour vérifier rapidement :

que la clé fonctionne ;
que la région est correcte ;
que l’ID du modèle est accepté ;
que la réponse JSON a la structure attendue.

Exemple JavaScript

Installez le SDK :

npm install openai

Puis appelez l’API :

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const resp = await client.chat.completions.create({
  model: "qwen3.7-plus",
  messages: [
    {
      role: "user",
      content: "Bonjour depuis l'API Qwen 3.7 Plus.",
    },
  ],
});

console.log(resp.choices[0].message.content);

Envoyer une image à Qwen 3.7 Plus

La principale différence entre Plus et un modèle textuel est l’entrée multimodale. Le message utilisateur peut contenir un tableau de parties : texte, image ou vidéo.

Exemple avec une URL d’image publique :

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Quel bouton soumet ce formulaire ? Donnez les coordonnées en pixels."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/screenshot.png"
                    }
                },
            ],
        }
    ],
)

print(resp.choices[0].message.content)

Vous pouvez utiliser ce format pour des cas comme :

analyse de capture d’écran ;
description d’image ;
extraction d’informations visuelles ;
détection d’éléments UI ;
génération d’actions de type GUI-grounding.

Exemple de réponse attendue dans un agent GUI :

Le bouton de soumission semble être situé en bas à droite du formulaire.
Action suggérée : click at (x=487, y=232)

Envoyer une image en base64

Si votre image n’est pas disponible publiquement, encodez-la en base64 et transmettez-la comme URI de données.

import base64
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

with open("screenshot.png", "rb") as f:
    encoded = base64.b64encode(f.read()).decode("utf-8")

data_url = f"data:image/png;base64,{encoded}"

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Analyse cette capture d’écran et liste les éléments interactifs visibles."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": data_url
                    }
                },
            ],
        }
    ],
)

print(resp.choices[0].message.content)

Avant d’envoyer une image, appliquez quelques règles simples :

réduisez la résolution si la précision pixel-perfect n’est pas nécessaire ;
évitez d’envoyer plusieurs captures similaires ;
compressez les images volumineuses ;
masquez les données sensibles ;
mesurez le nombre de jetons consommés sur des exemples réels.

Envoyer une vidéo

La vidéo suit le même principe : elle est transmise comme partie multimodale du message. Les noms exacts des champs vidéo peuvent varier selon la région et la compatibilité active. Vérifiez donc la documentation de compatibilité OpenAI avec DashScope avant de figer votre schéma.

Pour limiter le coût :

échantillonnez moins d’images par seconde ;
envoyez uniquement les segments utiles ;
réduisez la résolution ;
évitez les longues vidéos brutes ;
préférez des captures clés si le cas d’usage le permet.

Tarification

Qwen 3.7 Plus est positionné comme un modèle multimodal économique.

Modèle	Entrée / 1M	Sortie / 1M	Entrée en cache / 1M
Qwen 3.7 Plus	$0.40	$1.60	$0.08
Qwen 3.7 Max	$2.50	$7.50	$0.25

Cela représente environ six fois moins cher que Max pour les jetons d’entrée. Il n’y a pas de niveau gratuit permanent, mais les nouveaux comptes Model Studio reçoivent un quota gratuit unique, généralement dans la région de Singapour, pour évaluer le modèle avant de passer au paiement à l’usage.

L’ancienne méthode gratuite Qwen OAuth a été retirée le 15 avril 2026. Ne construisez donc pas votre intégration dessus.

Sources officielles :

Pour tester la famille Qwen sans coût initial, consultez aussi le guide Qwen 3.7 gratuit.

Estimer le coût d’une requête

Le texte coûte peu. Les images et vidéos peuvent faire monter la facture, car elles sont converties en jetons et partagent le même budget de contexte de 1 million de jetons.

Requête	Jetons d’entrée	Jetons de sortie	Coût approximatif
Requête texte uniquement	10 000	2 000	~0,007 $
Une capture d’écran 1080p + prompt	~1 500	300	~0,001 $
Vidéo de 30s échantillonnée à 2 ips	~77 000	500	~0,032 $

Les chiffres de jetons par image sont approximatifs. Ils dépendent de la résolution, du format et du taux d’échantillonnage.

Règle pratique :

un agent textuel reste très bon marché ;
une capture d’écran occasionnelle reste raisonnable ;
une charge de travail vidéo peut coûter beaucoup plus cher par appel.

Pour réduire les coûts :

Diminuez la résolution des captures.
Envoyez uniquement les zones utiles de l’interface.
Échantillonnez les vidéos avec parcimonie.
Réutilisez le contexte quand le cache est applicable.
Mesurez les coûts sur vos charges utiles réelles.

Pour aller plus loin, voir les notes sur la réduction des coûts de jetons d’agent et la guerre des prix des LLM chinois de 2026.

Limites de débit et erreurs courantes

Model Studio applique des limites par compte, notamment :

requêtes par minute ;
jetons par minute ;
quotas dépendant de la région ;
plafonds dépendant du niveau de compte.

Consultez la page de quota dans la console Model Studio pour connaître vos limites réelles. Si vous les atteignez régulièrement, demandez une augmentation.

Erreur 401 : non autorisé

Causes fréquentes :

clé incorrecte ;
clé expirée ou révoquée ;
clé créée dans une autre région ;
variable d’environnement non chargée.

À vérifier :

echo $DASHSCOPE_API_KEY

Puis confirmez que l’URL de base correspond bien à la région de la clé.

Erreur 429 : trop de requêtes

Vous avez atteint une limite de débit. Ajoutez un retry avec délai exponentiel.

Exemple Python minimal :

import time
from openai import OpenAI

def call_with_retry(client: OpenAI, payload: dict, max_retries: int = 5):
    for attempt in range(max_retries):
        try:
            return client.chat.completions.create(**payload)
        except Exception as e:
            if attempt == max_retries - 1:
                raise

            wait = 2 ** attempt
            print(f"Erreur API, nouvelle tentative dans {wait}s: {e}")
            time.sleep(wait)

Utilisation :

payload = {
    "model": "qwen3.7-plus",
    "messages": [
        {
            "role": "user",
            "content": "Résume ce texte en trois points."
        }
    ],
}

resp = call_with_retry(client, payload)
print(resp.choices[0].message.content)

Erreur 400 : mauvaise requête

Causes fréquentes :

charge utile multimodale mal formée ;
champ content incorrect ;
image trop volumineuse ;
schéma vidéo incompatible ;
dépassement du contexte après conversion des images en jetons.

Avant l’envoi, validez :

le type MIME de l’image ;
la taille du fichier ;
le format du tableau content ;
le nombre d’images ;
la région et la compatibilité du schéma utilisé.

Tester et simuler l’API avec Apidog

Les requêtes multimodales deviennent vite difficiles à déboguer : images en base64, tableaux imbriqués, réponses JSON longues, appels d’outils et erreurs de schéma.

Apidog permet de tester ces appels dans un espace de travail API :

configurez l’URL de base DashScope ;
stockez la clé Model Studio dans un environnement ;
envoyez des requêtes texte, image ou vidéo ;
inspectez la réponse JSON brute ;
documentez le point d’accès ;
simulez l’API pendant que le frontend ou l’agent est encore en développement.

Pour un agent qui enchaîne plusieurs appels d’outils, le débogueur d’agent IA d’Apidog aide à visualiser la séquence complète et à identifier l’étape qui échoue.

Vous pouvez télécharger Apidog pour tester, déboguer et simuler l’API Qwen 3.7 Plus avant de l’intégrer en production.

Checklist d’intégration

Avant de passer en production :

[ ] Confirmer l’ID du modèle dans la documentation Model Studio.
[ ] Choisir la bonne région.
[ ] Créer une clé API pour cette région.
[ ] Stocker la clé dans une variable d’environnement ou un gestionnaire de secrets.
[ ] Tester une requête texte simple.
[ ] Tester une requête avec image.
[ ] Valider le format des charges utiles multimodales.
[ ] Ajouter un retry pour 429 et 5xx.
[ ] Réduire la taille des images et vidéos.
[ ] Estimer le coût avec des charges utiles réelles.
[ ] Tester les erreurs dans Apidog ou un outil équivalent.
[ ] Surveiller les quotas dans Model Studio.

FAQ

Existe-t-il un niveau gratuit pour l’API Qwen 3.7 Plus ?

Pas de niveau gratuit permanent. Les nouveaux comptes Alibaba Cloud Model Studio reçoivent un quota gratuit unique pour l’évaluation, généralement dans la région de Singapour. Ensuite, la facturation passe au paiement à l’usage.

Quel est l’ID du modèle ?

L’ID utilisé est qwen3.7-plus sur Model Studio. Comme les identifiants peuvent changer, vérifiez la liste officielle des modèles avant de déployer.

Comment le coût des images et vidéos est-il calculé ?

Le contenu visuel est converti en jetons facturés au tarif d’entrée standard. Une capture 1080p peut représenter quelques milliers de jetons. Une vidéo ajoute des jetons pour chaque image échantillonnée.

En quoi Qwen 3.7 Plus diffère-t-il de Qwen 3.7 Max ?

Les deux utilisent une API compatible OpenAI et des URL de base similaires. Plus accepte les entrées image et vidéo et coûte environ six fois moins cher pour l’entrée. Max est uniquement textuel et conserve un léger avantage sur certains benchmarks textuels.

Puis-je auto-héberger Qwen 3.7 Plus ?

Non. Les poids sont fermés. Le modèle fonctionne uniquement via Alibaba Cloud Model Studio.

Quelle URL de base dois-je utiliser ?

Utilisez l’URL correspondant à la région où votre clé a été créée : Singapour, États-Unis/Virginie ou Pékin. Une clé régionale ne s’authentifie pas auprès d’un point d’accès d’une autre région.

En résumé

Pour utiliser Qwen 3.7 Plus, configurez le SDK OpenAI avec l’URL de base DashScope, transmettez votre clé Model Studio, puis appelez /chat/completions avec qwen3.7-plus. Pour le multimodal, ajoutez des parties image ou vidéo dans le tableau content.

Le coût reste faible pour le texte, mais augmente avec la taille et le nombre de contenus visuels envoyés. La bonne pratique consiste donc à réduire les images, échantillonner les vidéos et tester les charges utiles réelles avant la production.

DEV Community