Emre Demir

Posted on Jun 3 • Originally published at apidog.com

Wie verwendet man die Qwen 3.7 Plus API?

Qwen 3.7 Plus ist Alibabas multimodales Agentenmodell für Text-, Bild- und Videoeingaben mit 1M-Token-Kontext und Budgetpreis. Da es nur als API verfügbar ist, sind die wichtigsten Fragen praktisch: Wie erhalten Sie einen API-Schlüssel, wie senden Sie Bild- oder Video-Payloads und wie kalkulieren Sie die Kosten?

Teste Apidog noch heute

In diesem Leitfaden richten Sie den Zugriff über Alibaba Cloud Model Studio ein, senden erste Requests mit Python, curl und JavaScript, bauen multimodale Payloads und prüfen Preise, Ratenlimits und typische Fehler. Für Tests, Debugging und Mocking können Sie Apidog verwenden. Wenn Sie zuerst Fähigkeiten und Benchmarks einordnen möchten, lesen Sie die Qwen 3.7 Plus Übersicht; für das textbasierte Flaggschiff siehe den Grundlagenleitfaden zur Qwen 3.7 API.

TL;DR

Qwen 3.7 Plus läuft über Alibaba Cloud Model Studio an einem OpenAI-kompatiblen Endpunkt. Sie setzen eine regionale base_url, übergeben Ihren Schlüssel als Bearer-Token und rufen /chat/completions mit der Modell-ID qwen3.7-plus auf. Multimodale Requests ergänzen den Nachrichteninhalt um Bild- oder Video-Parts.

Die Preise betragen:

$0.40 / 1 Mio. Eingabe-Tokens
$1.60 / 1 Mio. Ausgabe-Tokens
$0.08 / 1 Mio. zwischengespeicherte Eingabe-Tokens

Es gibt keinen dauerhaften kostenlosen Tarif, aber neue Konten erhalten eine einmalige kostenlose Quote. Vision-Tokens zählen zum Kontextbudget und erhöhen die Kosten. Prüfen Sie die exakte Modell-ID immer in der Model-Studio-Dokumentation, bevor Sie produktiv gehen.

Auf Qwen 3.7 Plus zugreifen

Qwen 3.7 Plus ist eine kommerzielle API. Für Entwickler sind zwei Zugriffswege relevant.

Option 1: Qwen Chat

chat.qwen.ai ist der schnellste Weg für eine manuelle Evaluation. Sie melden sich an, wählen das Plus-Modell, laden einen Screenshot hoch und prüfen, ob das Modell brauchbare Antworten liefert.

Verwenden Sie diesen Weg für:

schnelle Tests mit Bildern
qualitative Evaluation
Prompt-Ideen

Nicht geeignet ist er für:

API-Integration
automatisierte Tests
Produktionsworkloads

Option 2: Alibaba Cloud Model Studio

Alibaba Cloud Model Studio, auch DashScope, ist der eigentliche API-Zugang. Der Endpunkt ist OpenAI-kompatibel. Dadurch können Sie viele bestehende OpenAI-SDK-Integrationen weiterverwenden und nur folgende Werte austauschen:

api_key
base_url
model

Qwen 3.7 Plus ist proprietär. Es gibt keine offenen Gewichte zum Herunterladen, Sie können es also nicht selbst hosten oder air-gapped betreiben. Mehr zu diesem Trade-off finden Sie in der Qwen 3.7 Plus Übersicht.

Methode	API-Zugriff	Kosten	Am besten für
Qwen Chat (chat.qwen.ai)	Nein	Kostenlos, ratenbegrenzt	Schnelle Evaluation mit Bildern
Model Studio (DashScope)	Ja, OpenAI-kompatibel	Pay-per-Token	Produktionsintegration
Selbst-Hosting	Nein	n. v.	Nicht verfügbar; Gewichte sind geschlossen

API-Schlüssel für Qwen 3.7 Plus erstellen

Der Zugriff erfolgt über ein Alibaba-Cloud-Konto.

Erstellen Sie ein Alibaba-Cloud-Konto.
Öffnen Sie die Model-Studio-Konsole unter modelstudio.console.alibabacloud.com.
Aktivieren Sie Model Studio für Ihr Konto und Ihre Region.
Öffnen Sie den Bereich für API-Schlüssel.
Generieren Sie einen neuen Schlüssel.
Kopieren Sie ihn sofort und speichern Sie ihn sicher.

Ein Schlüssel sieht typischerweise so aus:

sk-...

Wichtig: Schlüssel sind regional gebunden. Ein Schlüssel aus Singapur funktioniert nicht automatisch mit dem Endpunkt für Peking oder Virginia.

Regionale Base-URLs

Region	Basis-URL
Singapur	`https://dashscope-intl.aliyuncs.com/compatible-mode/v1`
USA (Virginia)	`https://dashscope-us.aliyuncs.com/compatible-mode/v1`
Peking (China)	`https://dashscope.aliyuncs.com/compatible-mode/v1`

Speichern Sie den Schlüssel nicht im Code. Verwenden Sie eine Umgebungsvariable.

# macOS / Linux
export DASHSCOPE_API_KEY="sk-Ihr-Schlüssel-hier"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-Ihr-Schlüssel-hier"

Erste Anfrage senden

Der Chat-Completions-Endpunkt lautet:

/chat/completions

Die Modell-ID ist:

qwen3.7-plus

Prüfen Sie die aktuelle ID vor dem Produktivstart in der Model Studio-Modellliste, da sich Kennungen ändern können.

Python-Beispiel mit dem OpenAI SDK

Installieren Sie zuerst das SDK:

pip install openai

Dann senden Sie einen einfachen Text-Request:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": "Fassen Sie das Qwen 3.7 Plus Preismodell in zwei Sätzen zusammen."
        }
    ],
)

print(resp.choices[0].message.content)

Wenn Sie eine andere Region verwenden, ersetzen Sie base_url durch die passende regionale URL.

curl-Beispiel

Für einen schnellen Smoke-Test reicht curl:

curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.7-plus",
    "messages": [
      {
        "role": "user",
        "content": "Hallo von der Qwen 3.7 Plus API."
      }
    ]
  }'

Wenn der Request fehlschlägt, prüfen Sie zuerst:

Ist DASHSCOPE_API_KEY gesetzt?
Passt der Schlüssel zur Region der Base-URL?
Ist die Modell-ID korrekt?
Ist Model Studio für das Konto aktiviert?

JavaScript-Beispiel

Installieren Sie das SDK:

npm install openai

Dann:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const resp = await client.chat.completions.create({
  model: "qwen3.7-plus",
  messages: [
    {
      role: "user",
      content: "Hallo von der Qwen 3.7 Plus API.",
    },
  ],
});

console.log(resp.choices[0].message.content);

Bilder senden

Der Hauptgrund für Qwen 3.7 Plus ist multimodale Eingabe. Dafür setzen Sie content nicht als String, sondern als Array aus Content-Parts.

Beispiel mit Bild-URL:

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Welcher Button sendet dieses Formular? Geben Sie Pixelkoordinaten an."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/screenshot.png"
                    }
                },
            ],
        }
    ],
)

print(resp.choices[0].message.content)

Sie können Bilder üblicherweise als öffentliche URL oder als Base64-Daten-URI übergeben.

Beispielstruktur für Base64:

{
  "type": "image_url",
  "image_url": {
    "url": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUg..."
  }
}

Nutzen Sie Base64 nur, wenn eine öffentliche URL nicht praktikabel ist. Base64-Payloads werden schnell groß und sind unhandlicher beim Debugging.

Videos senden

Video-Payloads folgen konzeptionell dem gleichen Muster: Sie fügen einen Video-Part zum content-Array hinzu. Die genauen Part-Namen können je nach Region und API-Kompatibilitätsstand variieren. Prüfen Sie daher vor der Implementierung die aktuelle OpenAI-Kompatibilitätsdokumentation.

Für Video-Workloads ist wichtig:

Reduzieren Sie die Auflösung.
Sampeln Sie Frames sparsam.
Senden Sie nur relevante Ausschnitte.
Vermeiden Sie lange ungeschnittene Videos im Prompt.

Vision- und Video-Tokens zählen zum gleichen Kontextbudget wie Text.

Praktisches Muster: GUI-Grounding

Ein typischer Qwen-3.7-Plus-Use-Case ist GUI-Grounding. Sie senden einen Screenshot und bitten das Modell, eine Aktion mit Koordinaten zurückzugeben.

Beispiel-Prompt:

Analysiere den Screenshot. Finde den Button, der das Formular absendet.
Antworte ausschließlich als JSON:

{
  "action": "click",
  "x": number,
  "y": number,
  "reason": string
}

Beispiel-Request:

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": """Analysiere den Screenshot. Finde den Button, der das Formular absendet.
Antworte ausschließlich als JSON:

{
  "action": "click",
  "x": number,
  "y": number,
  "reason": string
}
"""
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/form-screenshot.png"
                    }
                }
            ]
        }
    ]
)

print(resp.choices[0].message.content)

Für produktive Agenten sollten Sie die Antwort validieren, bevor Sie eine Aktion ausführen.

Preise

Qwen 3.7 Plus ist als kostengünstige multimodale Stufe positioniert.

Modell	Eingabe / 1 Mio.	Ausgabe / 1 Mio.	Zwischengespeicherte Eingabe / 1 Mio.
Qwen 3.7 Plus	$0.40	$1.60	$0.08
Qwen 3.7 Max	$2.50	$7.50	$0.25

Plus ist damit bei Eingabe-Tokens etwa sechsmal günstiger als Max.

Es gibt keinen dauerhaften kostenlosen Tarif. Neue Model-Studio-Konten erhalten jedoch eine einmalige kostenlose Token-Quote, häufig in der Region Singapur. Danach erfolgt die Abrechnung nach Verbrauch. Der alte kostenlose Qwen-OAuth-Pfad wurde am 15. April 2026 eingestellt und sollte nicht als Integrationsbasis genutzt werden.

Offizielle Zahlen finden Sie auf der Model Studio-Preisseite und im Leitfaden für kostenlose Quoten. Für weitere kostenlose Testmöglichkeiten der Qwen-Familie siehe den Qwen 3.7 kostenlos Leitfaden.

Beispielkosten berechnen

Text ist meist günstig. Bilder und Videos können die Kosten stärker treiben, weil sie in Tokens umgewandelt werden.

Anfrage	Eingabe-Tokens	Ausgabe-Tokens	Ungefähre Kosten
Nur-Text-Prompt	10,000	2,000	~$0.007
Ein 1080p Screenshot + Prompt	~1,500	300	~$0.001
30s Video, gesampelt mit 2 fps	~77,000	500	~$0.032

Die Zahlen für visuelle Tokens sind Näherungen und hängen von Auflösung, Sampling und Payload ab. Die praktische Regel lautet:

Screenshots vor dem Senden verkleinern.
Nur relevante Bildbereiche senden.
Videos kürzen.
Sampling-Rate reduzieren.
Wiederverwendbare Prompt-Teile cachen, wenn möglich.

Für eine breitere Kostenstrategie lesen Sie auch die Hinweise zur Reduzierung der Agenten-Token-Kosten und den Artikel zum chinesischen LLM-Preiskrieg 2026.

Ratenbegrenzungen

Model Studio erzwingt Limits pro Konto. Diese hängen von Kontostufe und Region ab, typischerweise in:

Requests pro Minute
Tokens pro Minute
ggf. gleichzeitigen Requests

Es gibt keine einzelne universelle Zahl für alle Konten. Prüfen Sie die Quoten-Seite in der Model-Studio-Konsole. Wenn Sie die Limits erreichen, beantragen Sie dort eine Erhöhung.

Häufige Fehler behandeln

401 Unauthorized

Typische Ursachen:

falscher API-Schlüssel
Schlüssel wurde deaktiviert
Schlüssel gehört zu einer anderen Region als die Base-URL
Authorization: Bearer ... fehlt

Prüfen Sie:

echo $DASHSCOPE_API_KEY

und gleichen Sie die Region mit der Base-URL ab.

429 Too Many Requests

Sie haben ein Rate Limit erreicht. Implementieren Sie Backoff.

Beispiel in Python:

import time
from openai import OpenAI

def call_with_retry(client, payload, retries=5):
    delay = 1

    for attempt in range(retries):
        try:
            return client.chat.completions.create(**payload)
        except Exception as e:
            message = str(e)

            if "429" not in message and "500" not in message and "503" not in message:
                raise

            if attempt == retries - 1:
                raise

            time.sleep(delay)
            delay *= 2

400 Bad Request

Typische Ursachen:

falsch verschachteltes content-Array
falscher Part-Typ für Bild oder Video
zu großes Bild
Kontextlimit überschritten
ungültige Base64-Daten-URI

Prüfen Sie besonders bei multimodalen Requests die JSON-Struktur.

API mit Apidog testen und simulieren

Multimodale Requests sind fehleranfällig: Sie verschachteln Content-Arrays, senden Bild- oder Videoteile, inspizieren rohe JSON-Antworten und debuggen oft Tool-Calling- oder Agentenketten. Nur im Terminal zu testen wird schnell unübersichtlich.

Mit Apidog können Sie dafür einen API-Arbeitsbereich einrichten:

Erstellen Sie ein neues Projekt.
Legen Sie die regionale DashScope-Base-URL als Environment-Wert an.
Speichern Sie DASHSCOPE_API_KEY als Secret oder Environment-Variable.
Erstellen Sie einen POST /chat/completions Request.
Senden Sie Text-, Bild- oder Video-Payloads.
Inspizieren Sie die rohe JSON-Antwort.
Speichern Sie funktionierende Requests als wiederverwendbare Beispiele.
Mocken Sie den Endpunkt, damit Frontend oder Agentenlogik weiterentwickelt werden können, während Prompts noch optimiert werden.

Wenn Qwen 3.7 Plus Tool-Aufrufe über GUI- oder CLI-Agenten verkettet, hilft der Apidog AI-Agenten-Debugger, die Sequenz nachzuvollziehen und fehlerhafte Schritte zu isolieren.

Sie können Apidog herunterladen, um die Qwen 3.7 Plus API vor dem Produktivstart zu testen, zu debuggen und zu simulieren.

FAQ

Gibt es einen kostenlosen Tarif für die Qwen 3.7 Plus API?

Nein, es gibt keinen dauerhaften kostenlosen Tarif. Neue Alibaba Cloud Model Studio-Konten erhalten eine einmalige kostenlose Token-Quote zur Evaluation. Danach wird nach Verbrauch abgerechnet.

Wie lautet die Modell-ID?

Die Modell-ID ist qwen3.7-plus auf Model Studio. Prüfen Sie die aktuelle Kennung trotzdem vor dem Produktivstart in der Model-Studio-Modellliste.

Wie werden Bild- und Videokosten berechnet?

Visuelle Inhalte werden in Tokens umgewandelt und zum Standard-Eingabetarif berechnet. Ein 1080p-Screenshot kann einige Tausend Tokens kosten. Videos fügen Tokens pro gesampeltem Frame hinzu, wodurch große Medien-Payloads die Rechnung dominieren können.

Wie unterscheidet sich Qwen 3.7 Plus von Qwen 3.7 Max?

Die API-Form und die Base-URLs sind ähnlich OpenAI-kompatibel. Plus akzeptiert zusätzlich Bild- und Videoteile im Nachrichteninhalt und kostet etwa sechsmal weniger bei Eingabe-Tokens. Max ist rein textbasiert und behält einen Vorteil bei reinen Text-Benchmarks.

Kann ich Qwen 3.7 Plus selbst hosten?

Nein. Die Gewichte sind geschlossen. Qwen 3.7 Plus läuft nur über Alibaba Cloud Model Studio.

Welche Base-URL sollte ich verwenden?

Verwenden Sie die Base-URL der Region, in der Sie Ihren Schlüssel erstellt haben:

Singapur: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
USA/Virginia: https://dashscope-us.aliyuncs.com/compatible-mode/v1
Peking: https://dashscope.aliyuncs.com/compatible-mode/v1

Ein Schlüssel authentifiziert sich nicht gegen den Endpunkt einer anderen Region.

Fazit

Qwen 3.7 Plus lässt sich wie ein OpenAI-kompatibler Chat-Completions-Endpunkt integrieren: Base-URL setzen, API-Schlüssel übergeben, Modell-ID angeben und bei Bedarf Bild- oder Videoteile im content-Array mitsenden. Die eigentliche Optimierung liegt weniger in der API selbst, sondern in der Payload-Disziplin: kleinere Bilder, kürzere Videos, sinnvolles Sampling und robuste Fehlerbehandlung.

Richten Sie zuerst den Schlüssel ein, senden Sie einen Text-Smoke-Test, erweitern Sie dann auf Bild- oder Video-Payloads und testen Sie den gesamten Workflow in Apidog, bevor Sie produktiv gehen.

DEV Community