Walse

Posted on May 21 • Originally published at apidog.com

Cara Menggunakan API Qwen 3.7

Tim Qwen Alibaba meluncurkan Qwen3.7-Max-Preview pada pertengahan Mei 2026. Pertanyaan praktis untuk developer: bagaimana cara memanggil model ini dari aplikasi sendiri? Model ini diposisikan sebagai sistem penalaran unggulan dengan jendela konteks 1M-token dan jejak chain-of-thought eksplisit, cocok untuk backend agen, analisis dokumen panjang, dan pembuatan kode. Karena masih berstatus preview, aksesnya terbatas, permukaan API dapat berubah, dan Anda perlu memverifikasi ID model serta endpoint sebelum menulis integrasi produksi.

Coba Apidog hari ini

TL;DR

Qwen3.7-Max-Preview adalah model penalaran unggulan Alibaba yang dirilis sebagai pratinjau pada 14 Mei 2026 dengan jendela konteks 1M-token. Selama pratinjau, cara paling cepat untuk mencobanya adalah Qwen Chat (chat.qwen.ai). Untuk integrasi API, jalurnya adalah Alibaba Cloud Model Studio atau DashScope, yang menyediakan endpoint kompatibel OpenAI. Anda mengatur base URL DashScope, mengirim API key sebagai Bearer token, lalu memanggil /chat/completions.

Karena tier 3.7 masih preview, selalu konfirmasi ID model dan endpoint terbaru di dokumentasi resmi sebelum deploy. Untuk menguji request, menyimpan skenario, dan membuat mock endpoint saat akses belum stabil, gunakan Apidog.

Cara mengakses Qwen 3.7 sekarang

Qwen tersedia lewat beberapa jalur. Tidak semuanya cocok untuk integrasi aplikasi.

1. Qwen Chat

Qwen Chat adalah cara tercepat untuk mengevaluasi Qwen3.7-Max-Preview.

Langkahnya:

Buka chat.qwen.ai.
Masuk dengan akun Qwen.
Pilih qwen3.7-max-preview dari model selector jika tersedia.
Aktifkan Thinking Mode untuk melihat jejak penalaran.
Uji prompt sebelum memindahkannya ke kode.

Keterbatasannya: ini bukan API. Gunakan untuk validasi prompt, bukan integrasi backend.

2. Alibaba Cloud Model Studio atau DashScope

Untuk aplikasi nyata, gunakan Alibaba Cloud Model Studio. DashScope mengekspos model Qwen melalui endpoint kompatibel OpenAI, sehingga Anda bisa memakai OpenAI SDK dengan mengganti:

base_url
API key
model

Tier lama seperti qwen3.6-max-preview dan keluarga qwen-max sudah tersedia di Model Studio. Untuk qwen3.7-max-preview, ketersediaan API publik dapat berbeda tergantung waktu, akun, dan wilayah.

3. Pola kompatibel OpenAI

Bentuk request umumnya seperti ini:

POST /compatible-mode/v1/chat/completions
Authorization: Bearer <DASHSCOPE_API_KEY>
Content-Type: application/json

Body:

{
  "model": "qwen3.7-max-preview",
  "messages": [
    {
      "role": "user",
      "content": "Explain idempotency in REST APIs."
    }
  ]
}

Konfirmasi ID model di dokumentasi resmi Qwen dan daftar model Model Studio. Jika Anda ingin mencoba jalur tanpa biaya terlebih dahulu, lihat panduan kami tentang menggunakan Qwen 3.7 secara gratis.

Metode akses sekilas

Metode	Akses API	Biaya	Terbaik untuk
Qwen Chat (chat.qwen.ai)	Tidak	Gratis, terbatas laju	Evaluasi cepat dan pengujian prompt
Alibaba Cloud Model Studio / DashScope	Ya, kompatibel OpenAI	Bayar per token	Integrasi produksi
Qwen di Hugging Face	Bobot, jika dirilis	Gratis untuk self-host	Model open-weight, bukan Max-Preview
Gateway pihak ketiga	Bervariasi	Bervariasi	Routing multi-model

Catatan penting: model Qwen open-weight dapat tersedia di Hugging Face, tetapi tier Max-Preview bersifat proprietary. Jangan mengharapkan bobot yang dapat diunduh untuk qwen3.7-max-preview.

Mendapatkan API key Qwen 3.7

Akses API dilakukan melalui Alibaba Cloud.

Langkah implementasi:

Buat akun Alibaba Cloud.
Buka konsol Model Studio di modelstudio.console.alibabacloud.com.
Aktifkan Model Studio untuk akun dan wilayah Anda.
Buka bagian API key.
Generate key baru.
Simpan key seperti password.

API key biasanya terlihat seperti:

sk-xxxxxxxxxxxxxxxx

Pilih wilayah dengan sengaja karena key dan endpoint memiliki cakupan wilayah.

Wilayah	Base URL
Singapura	`https://dashscope-intl.aliyuncs.com/compatible-mode/v1`
AS, Virginia	`https://dashscope-us.aliyuncs.com/compatible-mode/v1`
Beijing, Tiongkok	`https://dashscope.aliyuncs.com/compatible-mode/v1`

Jangan hardcode key di source code. Simpan sebagai environment variable.

# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"

Aplikasi Anda cukup membaca DASHSCOPE_API_KEY saat runtime. Pola yang sama juga berlaku untuk model lain, seperti yang dibahas di panduan API Gemini 3.5.

Request pertama: Python, curl, dan JavaScript

Endpoint Qwen di Model Studio kompatibel dengan OpenAI. Anda bisa memakai SDK OpenAI atau HTTP request biasa.

Sebelum menjalankan contoh berikut, verifikasi dulu ID model yang aktif di Model Studio. qwen3.7-max-preview adalah ID yang digunakan untuk model preview, tetapi string API dapat berubah selama periode pratinjau.

Python dengan OpenAI SDK

Instal SDK:

pip install openai

Kirim request:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

response = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "system",
            "content": "You are a precise coding assistant."
        },
        {
            "role": "user",
            "content": "Write a Python function that reverses a linked list."
        },
    ],
)

print(response.choices[0].message.content)

Struktur pentingnya:

base_url: endpoint DashScope sesuai wilayah
api_key: key dari environment variable
model: ID model Qwen
messages: daftar pesan dengan role system, user, atau assistant

curl

Gunakan curl untuk memastikan key, endpoint, dan model bekerja sebelum menulis kode aplikasi.

curl 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions' \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "qwen3.7-max-preview",
    "messages": [
      {
        "role": "user",
        "content": "Explain idempotency in REST APIs in two sentences."
      }
    ]
  }'

Jika berhasil, Anda akan menerima JSON berisi completion. Jika gagal, cek status HTTP dan body error.

JavaScript / Node.js

Instal SDK:

npm install openai

Contoh request:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const response = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [
    {
      role: "user",
      content: "List three trade-offs of GraphQL versus REST.",
    },
  ],
});

console.log(response.choices[0].message.content);

Satu pola request dapat dipakai lintas bahasa karena API-nya kompatibel dengan OpenAI.

Streaming response

Untuk aplikasi yang berhadapan langsung dengan pengguna, aktifkan streaming agar output muncul bertahap. Ini mengurangi kesan “blank screen” saat model sedang bernalar.

Python streaming

stream = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "user",
            "content": "Summarize the CAP theorem."
        },
    ],
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

Node.js streaming

const stream = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [
    {
      role: "user",
      content: "Summarize the CAP theorem.",
    },
  ],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

Streaming lebih penting untuk model penalaran seperti Qwen 3.7 karena model dapat menghabiskan waktu untuk proses reasoning sebelum memberi jawaban final.

Parameter penalaran dan Thinking Mode

Qwen3.7-Max-Preview adalah model penalaran. Model ini dapat menghasilkan chain-of-thought eksplisit di dalam blok <think> sebelum jawaban akhir.

Pada beberapa model Qwen yang dilayani lewat DashScope, perilaku berpikir dikontrol dengan flag seperti enable_thinking. Namun, nama parameter dan mekanismenya dapat berubah antar versi Qwen. Verifikasi referensi API terbaru sebelum mengandalkannya di produksi.

Contoh konseptual:

response = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "user",
            "content": (
                "A train leaves at 2pm averaging 60mph. "
                "A second leaves at 3pm at 75mph on the same route. "
                "When does the second catch the first?"
            ),
        },
    ],
    extra_body={
        "enable_thinking": True
    },
)

print(response.choices[0].message.content)

Gunakan reasoning secara selektif:

Aktifkan untuk matematika multi-langkah, debugging kode, perencanaan, dan analisis kompleks.
Nonaktifkan untuk klasifikasi sederhana, formatting, atau lookup singkat.
Ingat bahwa reasoning menambah token output dan latensi.
Putuskan apakah konten <think> akan ditampilkan ke pengguna atau disembunyikan.

Jika Anda membandingkan kualitas dan biaya model reasoning, lihat artikel kami tentang Qwen 3.7 vs GPT-5.5 vs Opus 4.7. Untuk loop agen yang menghabiskan banyak token, teknik pada artikel mengurangi biaya token agen juga relevan.

Penanganan error dan rate limit

Tangani error secara eksplisit agar aplikasi tidak gagal diam-diam.

Status HTTP	Makna	Tindakan
400	Request salah, JSON invalid, parameter tidak valid	Periksa body, ID model, dan nama field
401	API key hilang atau tidak valid	Verifikasi key dan wilayah endpoint
403	Tidak punya akses ke model	Pastikan akun diaktifkan untuk tier preview
404	Model tidak ditemukan	Cek ID model dan ketersediaan wilayah
429	Rate limit atau kuota habis	Gunakan retry dengan backoff
500 / 503	Error server	Retry dengan exponential backoff

Model preview lebih sering menghasilkan 403 atau 404 karena akses dibatasi dan ID model dapat berubah. Jika Anda mendapat error tersebut, kemungkinan masalahnya ada pada akses akun, wilayah, atau string model.

Contoh retry sederhana di Python:

import os
import time
from openai import OpenAI, RateLimitError, APIStatusError

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

def ask_qwen(prompt, max_retries=4):
    for attempt in range(max_retries):
        try:
            response = client.chat.completions.create(
                model="qwen3.7-max-preview",
                messages=[
                    {
                        "role": "user",
                        "content": prompt,
                    }
                ],
            )
            return response.choices[0].message.content

        except RateLimitError:
            wait = 2 ** attempt
            print(f"Rate limited. Retrying in {wait}s...")
            time.sleep(wait)

        except APIStatusError as e:
            print(f"API error {e.status_code}: {e.message}")
            raise

    raise RuntimeError("Failed after retries")

Aturan praktis:

Retry untuk 429, 500, dan 503.
Jangan retry otomatis untuk 400, 401, 403, atau 404.
Gunakan exponential backoff agar aplikasi tidak membanjiri API.
Log status code, request ID jika tersedia, dan ID model yang dipakai.

Menguji dan membuat mock API Qwen dengan Apidog

API preview sulit diuji karena akses dapat dibatasi, ID model dapat berubah, dan rate limit bisa ketat. Daripada menjalankan seluruh aplikasi setiap kali, lebih praktis menguji endpoint secara terisolasi.

Apidog membantu Anda:

Membuat request ke endpoint Qwen.
Menyimpan skenario test.
Mengelola header seperti Authorization.
Mengganti environment antara mock dan DashScope.
Membuat mock server saat API asli belum stabil.

Workflow yang bisa dipakai:

Buat request baru di Apidog.
Set method ke POST.
Gunakan endpoint:

   https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions

Tambahkan header:

   Authorization: Bearer {{DASHSCOPE_API_KEY}}
   Content-Type: application/json

Tambahkan body:

   {
     "model": "qwen3.7-max-preview",
     "messages": [
       {
         "role": "user",
         "content": "Explain idempotency in REST APIs."
       }
     ]
   }

Simpan sebagai test case.
Jalankan ulang saat ID model atau endpoint berubah.

Untuk kondisi ketika akses preview belum tersedia, buat mock endpoint dengan response realistis. Frontend atau agen Anda dapat dikembangkan terhadap mock server terlebih dahulu. Saat API langsung siap, ganti base URL dari mock ke DashScope tanpa mengubah struktur request.

Jika Anda memakai pendekatan schema-first, lihat panduan mode spec-first. Pola pengujian yang sama juga berlaku untuk API model lain seperti Gemini atau API ERNIE 5.1.

Kesimpulan

Memanggil Qwen 3.7 relatif sederhana jika Anda sudah tahu jalurnya:

Coba prompt di Qwen Chat.
Aktifkan Alibaba Cloud Model Studio.
Ambil API key.
Pilih base URL sesuai wilayah.
Panggil /chat/completions dengan pola kompatibel OpenAI.
Tambahkan streaming, reasoning control, retry, dan logging.
Uji serta mock endpoint dengan Apidog sebelum integrasi produksi.

Berhenti menebak response API dan mulai validasi request secara langsung. Unduh Apidog untuk mendesain endpoint Qwen, mengirim request test, menyimpan skenario reusable, dan membuat mock API saat Anda membangun.

DEV Community