Qwen 3.7 Plus ist Alibabas multimodales Agentenmodell für Text-, Bild- und Videoeingaben mit 1M-Token-Kontext und Budgetpreis. Da es nur als API verfügbar ist, sind die wichtigsten Fragen praktisch: Wie erhalten Sie einen API-Schlüssel, wie senden Sie Bild- oder Video-Payloads und wie kalkulieren Sie die Kosten?
In diesem Leitfaden richten Sie den Zugriff über Alibaba Cloud Model Studio ein, senden erste Requests mit Python, curl und JavaScript, bauen multimodale Payloads und prüfen Preise, Ratenlimits und typische Fehler. Für Tests, Debugging und Mocking können Sie Apidog verwenden. Wenn Sie zuerst Fähigkeiten und Benchmarks einordnen möchten, lesen Sie die Qwen 3.7 Plus Übersicht; für das textbasierte Flaggschiff siehe den Grundlagenleitfaden zur Qwen 3.7 API.
TL;DR
Qwen 3.7 Plus läuft über Alibaba Cloud Model Studio an einem OpenAI-kompatiblen Endpunkt. Sie setzen eine regionale base_url, übergeben Ihren Schlüssel als Bearer-Token und rufen /chat/completions mit der Modell-ID qwen3.7-plus auf. Multimodale Requests ergänzen den Nachrichteninhalt um Bild- oder Video-Parts.
Die Preise betragen:
- $0.40 / 1 Mio. Eingabe-Tokens
- $1.60 / 1 Mio. Ausgabe-Tokens
- $0.08 / 1 Mio. zwischengespeicherte Eingabe-Tokens
Es gibt keinen dauerhaften kostenlosen Tarif, aber neue Konten erhalten eine einmalige kostenlose Quote. Vision-Tokens zählen zum Kontextbudget und erhöhen die Kosten. Prüfen Sie die exakte Modell-ID immer in der Model-Studio-Dokumentation, bevor Sie produktiv gehen.
Auf Qwen 3.7 Plus zugreifen
Qwen 3.7 Plus ist eine kommerzielle API. Für Entwickler sind zwei Zugriffswege relevant.
Option 1: Qwen Chat
chat.qwen.ai ist der schnellste Weg für eine manuelle Evaluation. Sie melden sich an, wählen das Plus-Modell, laden einen Screenshot hoch und prüfen, ob das Modell brauchbare Antworten liefert.
Verwenden Sie diesen Weg für:
- schnelle Tests mit Bildern
- qualitative Evaluation
- Prompt-Ideen
Nicht geeignet ist er für:
- API-Integration
- automatisierte Tests
- Produktionsworkloads
Option 2: Alibaba Cloud Model Studio
Alibaba Cloud Model Studio, auch DashScope, ist der eigentliche API-Zugang. Der Endpunkt ist OpenAI-kompatibel. Dadurch können Sie viele bestehende OpenAI-SDK-Integrationen weiterverwenden und nur folgende Werte austauschen:
api_keybase_urlmodel
Qwen 3.7 Plus ist proprietär. Es gibt keine offenen Gewichte zum Herunterladen, Sie können es also nicht selbst hosten oder air-gapped betreiben. Mehr zu diesem Trade-off finden Sie in der Qwen 3.7 Plus Übersicht.
| Methode | API-Zugriff | Kosten | Am besten für |
|---|---|---|---|
| Qwen Chat (chat.qwen.ai) | Nein | Kostenlos, ratenbegrenzt | Schnelle Evaluation mit Bildern |
| Model Studio (DashScope) | Ja, OpenAI-kompatibel | Pay-per-Token | Produktionsintegration |
| Selbst-Hosting | Nein | n. v. | Nicht verfügbar; Gewichte sind geschlossen |
API-Schlüssel für Qwen 3.7 Plus erstellen
Der Zugriff erfolgt über ein Alibaba-Cloud-Konto.
- Erstellen Sie ein Alibaba-Cloud-Konto.
- Öffnen Sie die Model-Studio-Konsole unter
modelstudio.console.alibabacloud.com. - Aktivieren Sie Model Studio für Ihr Konto und Ihre Region.
- Öffnen Sie den Bereich für API-Schlüssel.
- Generieren Sie einen neuen Schlüssel.
- Kopieren Sie ihn sofort und speichern Sie ihn sicher.
Ein Schlüssel sieht typischerweise so aus:
sk-...
Wichtig: Schlüssel sind regional gebunden. Ein Schlüssel aus Singapur funktioniert nicht automatisch mit dem Endpunkt für Peking oder Virginia.
Regionale Base-URLs
| Region | Basis-URL |
|---|---|
| Singapur | https://dashscope-intl.aliyuncs.com/compatible-mode/v1 |
| USA (Virginia) | https://dashscope-us.aliyuncs.com/compatible-mode/v1 |
| Peking (China) | https://dashscope.aliyuncs.com/compatible-mode/v1 |
Speichern Sie den Schlüssel nicht im Code. Verwenden Sie eine Umgebungsvariable.
# macOS / Linux
export DASHSCOPE_API_KEY="sk-Ihr-Schlüssel-hier"
# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-Ihr-Schlüssel-hier"
Erste Anfrage senden
Der Chat-Completions-Endpunkt lautet:
/chat/completions
Die Modell-ID ist:
qwen3.7-plus
Prüfen Sie die aktuelle ID vor dem Produktivstart in der Model Studio-Modellliste, da sich Kennungen ändern können.
Python-Beispiel mit dem OpenAI SDK
Installieren Sie zuerst das SDK:
pip install openai
Dann senden Sie einen einfachen Text-Request:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DASHSCOPE_API_KEY"],
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": "Fassen Sie das Qwen 3.7 Plus Preismodell in zwei Sätzen zusammen."
}
],
)
print(resp.choices[0].message.content)
Wenn Sie eine andere Region verwenden, ersetzen Sie base_url durch die passende regionale URL.
curl-Beispiel
Für einen schnellen Smoke-Test reicht curl:
curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "Hallo von der Qwen 3.7 Plus API."
}
]
}'
Wenn der Request fehlschlägt, prüfen Sie zuerst:
- Ist
DASHSCOPE_API_KEYgesetzt? - Passt der Schlüssel zur Region der Base-URL?
- Ist die Modell-ID korrekt?
- Ist Model Studio für das Konto aktiviert?
JavaScript-Beispiel
Installieren Sie das SDK:
npm install openai
Dann:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});
const resp = await client.chat.completions.create({
model: "qwen3.7-plus",
messages: [
{
role: "user",
content: "Hallo von der Qwen 3.7 Plus API.",
},
],
});
console.log(resp.choices[0].message.content);
Bilder senden
Der Hauptgrund für Qwen 3.7 Plus ist multimodale Eingabe. Dafür setzen Sie content nicht als String, sondern als Array aus Content-Parts.
Beispiel mit Bild-URL:
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Welcher Button sendet dieses Formular? Geben Sie Pixelkoordinaten an."
},
{
"type": "image_url",
"image_url": {
"url": "https://example.com/screenshot.png"
}
},
],
}
],
)
print(resp.choices[0].message.content)
Sie können Bilder üblicherweise als öffentliche URL oder als Base64-Daten-URI übergeben.
Beispielstruktur für Base64:
{
"type": "image_url",
"image_url": {
"url": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUg..."
}
}
Nutzen Sie Base64 nur, wenn eine öffentliche URL nicht praktikabel ist. Base64-Payloads werden schnell groß und sind unhandlicher beim Debugging.
Videos senden
Video-Payloads folgen konzeptionell dem gleichen Muster: Sie fügen einen Video-Part zum content-Array hinzu. Die genauen Part-Namen können je nach Region und API-Kompatibilitätsstand variieren. Prüfen Sie daher vor der Implementierung die aktuelle OpenAI-Kompatibilitätsdokumentation.
Für Video-Workloads ist wichtig:
- Reduzieren Sie die Auflösung.
- Sampeln Sie Frames sparsam.
- Senden Sie nur relevante Ausschnitte.
- Vermeiden Sie lange ungeschnittene Videos im Prompt.
Vision- und Video-Tokens zählen zum gleichen Kontextbudget wie Text.
Praktisches Muster: GUI-Grounding
Ein typischer Qwen-3.7-Plus-Use-Case ist GUI-Grounding. Sie senden einen Screenshot und bitten das Modell, eine Aktion mit Koordinaten zurückzugeben.
Beispiel-Prompt:
Analysiere den Screenshot. Finde den Button, der das Formular absendet.
Antworte ausschließlich als JSON:
{
"action": "click",
"x": number,
"y": number,
"reason": string
}
Beispiel-Request:
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": """Analysiere den Screenshot. Finde den Button, der das Formular absendet.
Antworte ausschließlich als JSON:
{
"action": "click",
"x": number,
"y": number,
"reason": string
}
"""
},
{
"type": "image_url",
"image_url": {
"url": "https://example.com/form-screenshot.png"
}
}
]
}
]
)
print(resp.choices[0].message.content)
Für produktive Agenten sollten Sie die Antwort validieren, bevor Sie eine Aktion ausführen.
Preise
Qwen 3.7 Plus ist als kostengünstige multimodale Stufe positioniert.
| Modell | Eingabe / 1 Mio. | Ausgabe / 1 Mio. | Zwischengespeicherte Eingabe / 1 Mio. |
|---|---|---|---|
| Qwen 3.7 Plus | $0.40 | $1.60 | $0.08 |
| Qwen 3.7 Max | $2.50 | $7.50 | $0.25 |
Plus ist damit bei Eingabe-Tokens etwa sechsmal günstiger als Max.
Es gibt keinen dauerhaften kostenlosen Tarif. Neue Model-Studio-Konten erhalten jedoch eine einmalige kostenlose Token-Quote, häufig in der Region Singapur. Danach erfolgt die Abrechnung nach Verbrauch. Der alte kostenlose Qwen-OAuth-Pfad wurde am 15. April 2026 eingestellt und sollte nicht als Integrationsbasis genutzt werden.
Offizielle Zahlen finden Sie auf der Model Studio-Preisseite und im Leitfaden für kostenlose Quoten. Für weitere kostenlose Testmöglichkeiten der Qwen-Familie siehe den Qwen 3.7 kostenlos Leitfaden.
Beispielkosten berechnen
Text ist meist günstig. Bilder und Videos können die Kosten stärker treiben, weil sie in Tokens umgewandelt werden.
| Anfrage | Eingabe-Tokens | Ausgabe-Tokens | Ungefähre Kosten |
|---|---|---|---|
| Nur-Text-Prompt | 10,000 | 2,000 | ~$0.007 |
| Ein 1080p Screenshot + Prompt | ~1,500 | 300 | ~$0.001 |
| 30s Video, gesampelt mit 2 fps | ~77,000 | 500 | ~$0.032 |
Die Zahlen für visuelle Tokens sind Näherungen und hängen von Auflösung, Sampling und Payload ab. Die praktische Regel lautet:
- Screenshots vor dem Senden verkleinern.
- Nur relevante Bildbereiche senden.
- Videos kürzen.
- Sampling-Rate reduzieren.
- Wiederverwendbare Prompt-Teile cachen, wenn möglich.
Für eine breitere Kostenstrategie lesen Sie auch die Hinweise zur Reduzierung der Agenten-Token-Kosten und den Artikel zum chinesischen LLM-Preiskrieg 2026.
Ratenbegrenzungen
Model Studio erzwingt Limits pro Konto. Diese hängen von Kontostufe und Region ab, typischerweise in:
- Requests pro Minute
- Tokens pro Minute
- ggf. gleichzeitigen Requests
Es gibt keine einzelne universelle Zahl für alle Konten. Prüfen Sie die Quoten-Seite in der Model-Studio-Konsole. Wenn Sie die Limits erreichen, beantragen Sie dort eine Erhöhung.
Häufige Fehler behandeln
401 Unauthorized
Typische Ursachen:
- falscher API-Schlüssel
- Schlüssel wurde deaktiviert
- Schlüssel gehört zu einer anderen Region als die Base-URL
-
Authorization: Bearer ...fehlt
Prüfen Sie:
echo $DASHSCOPE_API_KEY
und gleichen Sie die Region mit der Base-URL ab.
429 Too Many Requests
Sie haben ein Rate Limit erreicht. Implementieren Sie Backoff.
Beispiel in Python:
import time
from openai import OpenAI
def call_with_retry(client, payload, retries=5):
delay = 1
for attempt in range(retries):
try:
return client.chat.completions.create(**payload)
except Exception as e:
message = str(e)
if "429" not in message and "500" not in message and "503" not in message:
raise
if attempt == retries - 1:
raise
time.sleep(delay)
delay *= 2
400 Bad Request
Typische Ursachen:
- falsch verschachteltes
content-Array - falscher Part-Typ für Bild oder Video
- zu großes Bild
- Kontextlimit überschritten
- ungültige Base64-Daten-URI
Prüfen Sie besonders bei multimodalen Requests die JSON-Struktur.
API mit Apidog testen und simulieren
Multimodale Requests sind fehleranfällig: Sie verschachteln Content-Arrays, senden Bild- oder Videoteile, inspizieren rohe JSON-Antworten und debuggen oft Tool-Calling- oder Agentenketten. Nur im Terminal zu testen wird schnell unübersichtlich.
Mit Apidog können Sie dafür einen API-Arbeitsbereich einrichten:
- Erstellen Sie ein neues Projekt.
- Legen Sie die regionale DashScope-Base-URL als Environment-Wert an.
- Speichern Sie
DASHSCOPE_API_KEYals Secret oder Environment-Variable. - Erstellen Sie einen
POST /chat/completionsRequest. - Senden Sie Text-, Bild- oder Video-Payloads.
- Inspizieren Sie die rohe JSON-Antwort.
- Speichern Sie funktionierende Requests als wiederverwendbare Beispiele.
- Mocken Sie den Endpunkt, damit Frontend oder Agentenlogik weiterentwickelt werden können, während Prompts noch optimiert werden.
Wenn Qwen 3.7 Plus Tool-Aufrufe über GUI- oder CLI-Agenten verkettet, hilft der Apidog AI-Agenten-Debugger, die Sequenz nachzuvollziehen und fehlerhafte Schritte zu isolieren.
Sie können Apidog herunterladen, um die Qwen 3.7 Plus API vor dem Produktivstart zu testen, zu debuggen und zu simulieren.
FAQ
Gibt es einen kostenlosen Tarif für die Qwen 3.7 Plus API?
Nein, es gibt keinen dauerhaften kostenlosen Tarif. Neue Alibaba Cloud Model Studio-Konten erhalten eine einmalige kostenlose Token-Quote zur Evaluation. Danach wird nach Verbrauch abgerechnet.
Wie lautet die Modell-ID?
Die Modell-ID ist qwen3.7-plus auf Model Studio. Prüfen Sie die aktuelle Kennung trotzdem vor dem Produktivstart in der Model-Studio-Modellliste.
Wie werden Bild- und Videokosten berechnet?
Visuelle Inhalte werden in Tokens umgewandelt und zum Standard-Eingabetarif berechnet. Ein 1080p-Screenshot kann einige Tausend Tokens kosten. Videos fügen Tokens pro gesampeltem Frame hinzu, wodurch große Medien-Payloads die Rechnung dominieren können.
Wie unterscheidet sich Qwen 3.7 Plus von Qwen 3.7 Max?
Die API-Form und die Base-URLs sind ähnlich OpenAI-kompatibel. Plus akzeptiert zusätzlich Bild- und Videoteile im Nachrichteninhalt und kostet etwa sechsmal weniger bei Eingabe-Tokens. Max ist rein textbasiert und behält einen Vorteil bei reinen Text-Benchmarks.
Kann ich Qwen 3.7 Plus selbst hosten?
Nein. Die Gewichte sind geschlossen. Qwen 3.7 Plus läuft nur über Alibaba Cloud Model Studio.
Welche Base-URL sollte ich verwenden?
Verwenden Sie die Base-URL der Region, in der Sie Ihren Schlüssel erstellt haben:
- Singapur:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1 - USA/Virginia:
https://dashscope-us.aliyuncs.com/compatible-mode/v1 - Peking:
https://dashscope.aliyuncs.com/compatible-mode/v1
Ein Schlüssel authentifiziert sich nicht gegen den Endpunkt einer anderen Region.
Fazit
Qwen 3.7 Plus lässt sich wie ein OpenAI-kompatibler Chat-Completions-Endpunkt integrieren: Base-URL setzen, API-Schlüssel übergeben, Modell-ID angeben und bei Bedarf Bild- oder Videoteile im content-Array mitsenden. Die eigentliche Optimierung liegt weniger in der API selbst, sondern in der Payload-Disziplin: kleinere Bilder, kürzere Videos, sinnvolles Sampling und robuste Fehlerbehandlung.
Richten Sie zuerst den Schlüssel ein, senden Sie einen Text-Smoke-Test, erweitern Sie dann auf Bild- oder Video-Payloads und testen Sie den gesamten Workflow in Apidog, bevor Sie produktiv gehen.


Top comments (0)