Tim Qwen Alibaba meluncurkan Qwen3.7-Max-Preview pada pertengahan Mei 2026. Pertanyaan praktis untuk developer: bagaimana cara memanggil model ini dari aplikasi sendiri? Model ini diposisikan sebagai sistem penalaran unggulan dengan jendela konteks 1M-token dan jejak chain-of-thought eksplisit, cocok untuk backend agen, analisis dokumen panjang, dan pembuatan kode. Karena masih berstatus preview, aksesnya terbatas, permukaan API dapat berubah, dan Anda perlu memverifikasi ID model serta endpoint sebelum menulis integrasi produksi.
TL;DR
Qwen3.7-Max-Preview adalah model penalaran unggulan Alibaba yang dirilis sebagai pratinjau pada 14 Mei 2026 dengan jendela konteks 1M-token. Selama pratinjau, cara paling cepat untuk mencobanya adalah Qwen Chat (chat.qwen.ai). Untuk integrasi API, jalurnya adalah Alibaba Cloud Model Studio atau DashScope, yang menyediakan endpoint kompatibel OpenAI. Anda mengatur base URL DashScope, mengirim API key sebagai Bearer token, lalu memanggil /chat/completions.
Karena tier 3.7 masih preview, selalu konfirmasi ID model dan endpoint terbaru di dokumentasi resmi sebelum deploy. Untuk menguji request, menyimpan skenario, dan membuat mock endpoint saat akses belum stabil, gunakan Apidog.
Cara mengakses Qwen 3.7 sekarang
Qwen tersedia lewat beberapa jalur. Tidak semuanya cocok untuk integrasi aplikasi.
1. Qwen Chat
Qwen Chat adalah cara tercepat untuk mengevaluasi Qwen3.7-Max-Preview.
Langkahnya:
- Buka chat.qwen.ai.
- Masuk dengan akun Qwen.
- Pilih
qwen3.7-max-previewdari model selector jika tersedia. - Aktifkan Thinking Mode untuk melihat jejak penalaran.
- Uji prompt sebelum memindahkannya ke kode.
Keterbatasannya: ini bukan API. Gunakan untuk validasi prompt, bukan integrasi backend.
2. Alibaba Cloud Model Studio atau DashScope
Untuk aplikasi nyata, gunakan Alibaba Cloud Model Studio. DashScope mengekspos model Qwen melalui endpoint kompatibel OpenAI, sehingga Anda bisa memakai OpenAI SDK dengan mengganti:
base_url- API key
model
Tier lama seperti qwen3.6-max-preview dan keluarga qwen-max sudah tersedia di Model Studio. Untuk qwen3.7-max-preview, ketersediaan API publik dapat berbeda tergantung waktu, akun, dan wilayah.
3. Pola kompatibel OpenAI
Bentuk request umumnya seperti ini:
POST /compatible-mode/v1/chat/completions
Authorization: Bearer <DASHSCOPE_API_KEY>
Content-Type: application/json
Body:
{
"model": "qwen3.7-max-preview",
"messages": [
{
"role": "user",
"content": "Explain idempotency in REST APIs."
}
]
}
Konfirmasi ID model di dokumentasi resmi Qwen dan daftar model Model Studio. Jika Anda ingin mencoba jalur tanpa biaya terlebih dahulu, lihat panduan kami tentang menggunakan Qwen 3.7 secara gratis.
Metode akses sekilas
| Metode | Akses API | Biaya | Terbaik untuk |
|---|---|---|---|
| Qwen Chat (chat.qwen.ai) | Tidak | Gratis, terbatas laju | Evaluasi cepat dan pengujian prompt |
| Alibaba Cloud Model Studio / DashScope | Ya, kompatibel OpenAI | Bayar per token | Integrasi produksi |
| Qwen di Hugging Face | Bobot, jika dirilis | Gratis untuk self-host | Model open-weight, bukan Max-Preview |
| Gateway pihak ketiga | Bervariasi | Bervariasi | Routing multi-model |
Catatan penting: model Qwen open-weight dapat tersedia di Hugging Face, tetapi tier Max-Preview bersifat proprietary. Jangan mengharapkan bobot yang dapat diunduh untuk qwen3.7-max-preview.
Mendapatkan API key Qwen 3.7
Akses API dilakukan melalui Alibaba Cloud.
Langkah implementasi:
- Buat akun Alibaba Cloud.
- Buka konsol Model Studio di
modelstudio.console.alibabacloud.com. - Aktifkan Model Studio untuk akun dan wilayah Anda.
- Buka bagian API key.
- Generate key baru.
- Simpan key seperti password.
API key biasanya terlihat seperti:
sk-xxxxxxxxxxxxxxxx
Pilih wilayah dengan sengaja karena key dan endpoint memiliki cakupan wilayah.
| Wilayah | Base URL |
|---|---|
| Singapura | https://dashscope-intl.aliyuncs.com/compatible-mode/v1 |
| AS, Virginia | https://dashscope-us.aliyuncs.com/compatible-mode/v1 |
| Beijing, Tiongkok | https://dashscope.aliyuncs.com/compatible-mode/v1 |
Jangan hardcode key di source code. Simpan sebagai environment variable.
# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"
# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"
Aplikasi Anda cukup membaca DASHSCOPE_API_KEY saat runtime. Pola yang sama juga berlaku untuk model lain, seperti yang dibahas di panduan API Gemini 3.5.
Request pertama: Python, curl, dan JavaScript
Endpoint Qwen di Model Studio kompatibel dengan OpenAI. Anda bisa memakai SDK OpenAI atau HTTP request biasa.
Sebelum menjalankan contoh berikut, verifikasi dulu ID model yang aktif di Model Studio. qwen3.7-max-preview adalah ID yang digunakan untuk model preview, tetapi string API dapat berubah selama periode pratinjau.
Python dengan OpenAI SDK
Instal SDK:
pip install openai
Kirim request:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DASHSCOPE_API_KEY"],
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
response = client.chat.completions.create(
model="qwen3.7-max-preview",
messages=[
{
"role": "system",
"content": "You are a precise coding assistant."
},
{
"role": "user",
"content": "Write a Python function that reverses a linked list."
},
],
)
print(response.choices[0].message.content)
Struktur pentingnya:
-
base_url: endpoint DashScope sesuai wilayah -
api_key: key dari environment variable -
model: ID model Qwen -
messages: daftar pesan dengan rolesystem,user, atauassistant
curl
Gunakan curl untuk memastikan key, endpoint, dan model bekerja sebelum menulis kode aplikasi.
curl 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "qwen3.7-max-preview",
"messages": [
{
"role": "user",
"content": "Explain idempotency in REST APIs in two sentences."
}
]
}'
Jika berhasil, Anda akan menerima JSON berisi completion. Jika gagal, cek status HTTP dan body error.
JavaScript / Node.js
Instal SDK:
npm install openai
Contoh request:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});
const response = await client.chat.completions.create({
model: "qwen3.7-max-preview",
messages: [
{
role: "user",
content: "List three trade-offs of GraphQL versus REST.",
},
],
});
console.log(response.choices[0].message.content);
Satu pola request dapat dipakai lintas bahasa karena API-nya kompatibel dengan OpenAI.
Streaming response
Untuk aplikasi yang berhadapan langsung dengan pengguna, aktifkan streaming agar output muncul bertahap. Ini mengurangi kesan “blank screen” saat model sedang bernalar.
Python streaming
stream = client.chat.completions.create(
model="qwen3.7-max-preview",
messages=[
{
"role": "user",
"content": "Summarize the CAP theorem."
},
],
stream=True,
)
for chunk in stream:
delta = chunk.choices[0].delta.content
if delta:
print(delta, end="", flush=True)
Node.js streaming
const stream = await client.chat.completions.create({
model: "qwen3.7-max-preview",
messages: [
{
role: "user",
content: "Summarize the CAP theorem.",
},
],
stream: true,
});
for await (const chunk of stream) {
process.stdout.write(chunk.choices[0]?.delta?.content || "");
}
Streaming lebih penting untuk model penalaran seperti Qwen 3.7 karena model dapat menghabiskan waktu untuk proses reasoning sebelum memberi jawaban final.
Parameter penalaran dan Thinking Mode
Qwen3.7-Max-Preview adalah model penalaran. Model ini dapat menghasilkan chain-of-thought eksplisit di dalam blok <think> sebelum jawaban akhir.
Pada beberapa model Qwen yang dilayani lewat DashScope, perilaku berpikir dikontrol dengan flag seperti enable_thinking. Namun, nama parameter dan mekanismenya dapat berubah antar versi Qwen. Verifikasi referensi API terbaru sebelum mengandalkannya di produksi.
Contoh konseptual:
response = client.chat.completions.create(
model="qwen3.7-max-preview",
messages=[
{
"role": "user",
"content": (
"A train leaves at 2pm averaging 60mph. "
"A second leaves at 3pm at 75mph on the same route. "
"When does the second catch the first?"
),
},
],
extra_body={
"enable_thinking": True
},
)
print(response.choices[0].message.content)
Gunakan reasoning secara selektif:
- Aktifkan untuk matematika multi-langkah, debugging kode, perencanaan, dan analisis kompleks.
- Nonaktifkan untuk klasifikasi sederhana, formatting, atau lookup singkat.
- Ingat bahwa reasoning menambah token output dan latensi.
- Putuskan apakah konten
<think>akan ditampilkan ke pengguna atau disembunyikan.
Jika Anda membandingkan kualitas dan biaya model reasoning, lihat artikel kami tentang Qwen 3.7 vs GPT-5.5 vs Opus 4.7. Untuk loop agen yang menghabiskan banyak token, teknik pada artikel mengurangi biaya token agen juga relevan.
Penanganan error dan rate limit
Tangani error secara eksplisit agar aplikasi tidak gagal diam-diam.
| Status HTTP | Makna | Tindakan |
|---|---|---|
| 400 | Request salah, JSON invalid, parameter tidak valid | Periksa body, ID model, dan nama field |
| 401 | API key hilang atau tidak valid | Verifikasi key dan wilayah endpoint |
| 403 | Tidak punya akses ke model | Pastikan akun diaktifkan untuk tier preview |
| 404 | Model tidak ditemukan | Cek ID model dan ketersediaan wilayah |
| 429 | Rate limit atau kuota habis | Gunakan retry dengan backoff |
| 500 / 503 | Error server | Retry dengan exponential backoff |
Model preview lebih sering menghasilkan 403 atau 404 karena akses dibatasi dan ID model dapat berubah. Jika Anda mendapat error tersebut, kemungkinan masalahnya ada pada akses akun, wilayah, atau string model.
Contoh retry sederhana di Python:
import os
import time
from openai import OpenAI, RateLimitError, APIStatusError
client = OpenAI(
api_key=os.environ["DASHSCOPE_API_KEY"],
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
def ask_qwen(prompt, max_retries=4):
for attempt in range(max_retries):
try:
response = client.chat.completions.create(
model="qwen3.7-max-preview",
messages=[
{
"role": "user",
"content": prompt,
}
],
)
return response.choices[0].message.content
except RateLimitError:
wait = 2 ** attempt
print(f"Rate limited. Retrying in {wait}s...")
time.sleep(wait)
except APIStatusError as e:
print(f"API error {e.status_code}: {e.message}")
raise
raise RuntimeError("Failed after retries")
Aturan praktis:
- Retry untuk
429,500, dan503. - Jangan retry otomatis untuk
400,401,403, atau404. - Gunakan exponential backoff agar aplikasi tidak membanjiri API.
- Log status code, request ID jika tersedia, dan ID model yang dipakai.
Menguji dan membuat mock API Qwen dengan Apidog
API preview sulit diuji karena akses dapat dibatasi, ID model dapat berubah, dan rate limit bisa ketat. Daripada menjalankan seluruh aplikasi setiap kali, lebih praktis menguji endpoint secara terisolasi.
Apidog membantu Anda:
- Membuat request ke endpoint Qwen.
- Menyimpan skenario test.
- Mengelola header seperti
Authorization. - Mengganti environment antara mock dan DashScope.
- Membuat mock server saat API asli belum stabil.
Workflow yang bisa dipakai:
- Buat request baru di Apidog.
- Set method ke
POST. - Gunakan endpoint:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions
- Tambahkan header:
Authorization: Bearer {{DASHSCOPE_API_KEY}}
Content-Type: application/json
- Tambahkan body:
{
"model": "qwen3.7-max-preview",
"messages": [
{
"role": "user",
"content": "Explain idempotency in REST APIs."
}
]
}
- Simpan sebagai test case.
- Jalankan ulang saat ID model atau endpoint berubah.
Untuk kondisi ketika akses preview belum tersedia, buat mock endpoint dengan response realistis. Frontend atau agen Anda dapat dikembangkan terhadap mock server terlebih dahulu. Saat API langsung siap, ganti base URL dari mock ke DashScope tanpa mengubah struktur request.
Jika Anda memakai pendekatan schema-first, lihat panduan mode spec-first. Pola pengujian yang sama juga berlaku untuk API model lain seperti Gemini atau API ERNIE 5.1.
Kesimpulan
Memanggil Qwen 3.7 relatif sederhana jika Anda sudah tahu jalurnya:
- Coba prompt di Qwen Chat.
- Aktifkan Alibaba Cloud Model Studio.
- Ambil API key.
- Pilih base URL sesuai wilayah.
- Panggil
/chat/completionsdengan pola kompatibel OpenAI. - Tambahkan streaming, reasoning control, retry, dan logging.
- Uji serta mock endpoint dengan Apidog sebelum integrasi produksi.
Berhenti menebak response API dan mulai validasi request secara langsung. Unduh Apidog untuk mendesain endpoint Qwen, mengirim request test, menyimpan skenario reusable, dan membuat mock API saat Anda membangun.


Top comments (0)