DEV Community

Cover image for Cara Menggunakan API Qwen 3.7
Walse
Walse

Posted on • Originally published at apidog.com

Cara Menggunakan API Qwen 3.7

Tim Qwen Alibaba meluncurkan Qwen3.7-Max-Preview pada pertengahan Mei 2026. Pertanyaan praktis untuk developer: bagaimana cara memanggil model ini dari aplikasi sendiri? Model ini diposisikan sebagai sistem penalaran unggulan dengan jendela konteks 1M-token dan jejak chain-of-thought eksplisit, cocok untuk backend agen, analisis dokumen panjang, dan pembuatan kode. Karena masih berstatus preview, aksesnya terbatas, permukaan API dapat berubah, dan Anda perlu memverifikasi ID model serta endpoint sebelum menulis integrasi produksi.

Coba Apidog hari ini

TL;DR

Qwen3.7-Max-Preview adalah model penalaran unggulan Alibaba yang dirilis sebagai pratinjau pada 14 Mei 2026 dengan jendela konteks 1M-token. Selama pratinjau, cara paling cepat untuk mencobanya adalah Qwen Chat (chat.qwen.ai). Untuk integrasi API, jalurnya adalah Alibaba Cloud Model Studio atau DashScope, yang menyediakan endpoint kompatibel OpenAI. Anda mengatur base URL DashScope, mengirim API key sebagai Bearer token, lalu memanggil /chat/completions.

Karena tier 3.7 masih preview, selalu konfirmasi ID model dan endpoint terbaru di dokumentasi resmi sebelum deploy. Untuk menguji request, menyimpan skenario, dan membuat mock endpoint saat akses belum stabil, gunakan Apidog.

Cara mengakses Qwen 3.7 sekarang

Qwen tersedia lewat beberapa jalur. Tidak semuanya cocok untuk integrasi aplikasi.

1. Qwen Chat

Qwen Chat adalah cara tercepat untuk mengevaluasi Qwen3.7-Max-Preview.

Langkahnya:

  1. Buka chat.qwen.ai.
  2. Masuk dengan akun Qwen.
  3. Pilih qwen3.7-max-preview dari model selector jika tersedia.
  4. Aktifkan Thinking Mode untuk melihat jejak penalaran.
  5. Uji prompt sebelum memindahkannya ke kode.

Keterbatasannya: ini bukan API. Gunakan untuk validasi prompt, bukan integrasi backend.

2. Alibaba Cloud Model Studio atau DashScope

Untuk aplikasi nyata, gunakan Alibaba Cloud Model Studio. DashScope mengekspos model Qwen melalui endpoint kompatibel OpenAI, sehingga Anda bisa memakai OpenAI SDK dengan mengganti:

  • base_url
  • API key
  • model

Tier lama seperti qwen3.6-max-preview dan keluarga qwen-max sudah tersedia di Model Studio. Untuk qwen3.7-max-preview, ketersediaan API publik dapat berbeda tergantung waktu, akun, dan wilayah.

Model Studio Qwen

3. Pola kompatibel OpenAI

Bentuk request umumnya seperti ini:

POST /compatible-mode/v1/chat/completions
Authorization: Bearer <DASHSCOPE_API_KEY>
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode

Body:

{
  "model": "qwen3.7-max-preview",
  "messages": [
    {
      "role": "user",
      "content": "Explain idempotency in REST APIs."
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode

Konfirmasi ID model di dokumentasi resmi Qwen dan daftar model Model Studio. Jika Anda ingin mencoba jalur tanpa biaya terlebih dahulu, lihat panduan kami tentang menggunakan Qwen 3.7 secara gratis.

Metode akses sekilas

Metode Akses API Biaya Terbaik untuk
Qwen Chat (chat.qwen.ai) Tidak Gratis, terbatas laju Evaluasi cepat dan pengujian prompt
Alibaba Cloud Model Studio / DashScope Ya, kompatibel OpenAI Bayar per token Integrasi produksi
Qwen di Hugging Face Bobot, jika dirilis Gratis untuk self-host Model open-weight, bukan Max-Preview
Gateway pihak ketiga Bervariasi Bervariasi Routing multi-model

Catatan penting: model Qwen open-weight dapat tersedia di Hugging Face, tetapi tier Max-Preview bersifat proprietary. Jangan mengharapkan bobot yang dapat diunduh untuk qwen3.7-max-preview.

Mendapatkan API key Qwen 3.7

Akses API dilakukan melalui Alibaba Cloud.

Langkah implementasi:

  1. Buat akun Alibaba Cloud.
  2. Buka konsol Model Studio di modelstudio.console.alibabacloud.com.
  3. Aktifkan Model Studio untuk akun dan wilayah Anda.
  4. Buka bagian API key.
  5. Generate key baru.
  6. Simpan key seperti password.

API key biasanya terlihat seperti:

sk-xxxxxxxxxxxxxxxx
Enter fullscreen mode Exit fullscreen mode

Pilih wilayah dengan sengaja karena key dan endpoint memiliki cakupan wilayah.

Wilayah Base URL
Singapura https://dashscope-intl.aliyuncs.com/compatible-mode/v1
AS, Virginia https://dashscope-us.aliyuncs.com/compatible-mode/v1
Beijing, Tiongkok https://dashscope.aliyuncs.com/compatible-mode/v1

Jangan hardcode key di source code. Simpan sebagai environment variable.

# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"
Enter fullscreen mode Exit fullscreen mode

Aplikasi Anda cukup membaca DASHSCOPE_API_KEY saat runtime. Pola yang sama juga berlaku untuk model lain, seperti yang dibahas di panduan API Gemini 3.5.

Request pertama: Python, curl, dan JavaScript

Endpoint Qwen di Model Studio kompatibel dengan OpenAI. Anda bisa memakai SDK OpenAI atau HTTP request biasa.

Sebelum menjalankan contoh berikut, verifikasi dulu ID model yang aktif di Model Studio. qwen3.7-max-preview adalah ID yang digunakan untuk model preview, tetapi string API dapat berubah selama periode pratinjau.

Python dengan OpenAI SDK

Instal SDK:

pip install openai
Enter fullscreen mode Exit fullscreen mode

Kirim request:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

response = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "system",
            "content": "You are a precise coding assistant."
        },
        {
            "role": "user",
            "content": "Write a Python function that reverses a linked list."
        },
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Struktur pentingnya:

  • base_url: endpoint DashScope sesuai wilayah
  • api_key: key dari environment variable
  • model: ID model Qwen
  • messages: daftar pesan dengan role system, user, atau assistant

curl

Gunakan curl untuk memastikan key, endpoint, dan model bekerja sebelum menulis kode aplikasi.

curl 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions' \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "qwen3.7-max-preview",
    "messages": [
      {
        "role": "user",
        "content": "Explain idempotency in REST APIs in two sentences."
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

Jika berhasil, Anda akan menerima JSON berisi completion. Jika gagal, cek status HTTP dan body error.

JavaScript / Node.js

Instal SDK:

npm install openai
Enter fullscreen mode Exit fullscreen mode

Contoh request:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const response = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [
    {
      role: "user",
      content: "List three trade-offs of GraphQL versus REST.",
    },
  ],
});

console.log(response.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Satu pola request dapat dipakai lintas bahasa karena API-nya kompatibel dengan OpenAI.

Streaming response

Untuk aplikasi yang berhadapan langsung dengan pengguna, aktifkan streaming agar output muncul bertahap. Ini mengurangi kesan “blank screen” saat model sedang bernalar.

Python streaming

stream = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "user",
            "content": "Summarize the CAP theorem."
        },
    ],
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)
Enter fullscreen mode Exit fullscreen mode

Node.js streaming

const stream = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [
    {
      role: "user",
      content: "Summarize the CAP theorem.",
    },
  ],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}
Enter fullscreen mode Exit fullscreen mode

Streaming lebih penting untuk model penalaran seperti Qwen 3.7 karena model dapat menghabiskan waktu untuk proses reasoning sebelum memberi jawaban final.

Parameter penalaran dan Thinking Mode

Qwen3.7-Max-Preview adalah model penalaran. Model ini dapat menghasilkan chain-of-thought eksplisit di dalam blok <think> sebelum jawaban akhir.

Pada beberapa model Qwen yang dilayani lewat DashScope, perilaku berpikir dikontrol dengan flag seperti enable_thinking. Namun, nama parameter dan mekanismenya dapat berubah antar versi Qwen. Verifikasi referensi API terbaru sebelum mengandalkannya di produksi.

Contoh konseptual:

response = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "user",
            "content": (
                "A train leaves at 2pm averaging 60mph. "
                "A second leaves at 3pm at 75mph on the same route. "
                "When does the second catch the first?"
            ),
        },
    ],
    extra_body={
        "enable_thinking": True
    },
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Gunakan reasoning secara selektif:

  • Aktifkan untuk matematika multi-langkah, debugging kode, perencanaan, dan analisis kompleks.
  • Nonaktifkan untuk klasifikasi sederhana, formatting, atau lookup singkat.
  • Ingat bahwa reasoning menambah token output dan latensi.
  • Putuskan apakah konten <think> akan ditampilkan ke pengguna atau disembunyikan.

Jika Anda membandingkan kualitas dan biaya model reasoning, lihat artikel kami tentang Qwen 3.7 vs GPT-5.5 vs Opus 4.7. Untuk loop agen yang menghabiskan banyak token, teknik pada artikel mengurangi biaya token agen juga relevan.

Penanganan error dan rate limit

Tangani error secara eksplisit agar aplikasi tidak gagal diam-diam.

Status HTTP Makna Tindakan
400 Request salah, JSON invalid, parameter tidak valid Periksa body, ID model, dan nama field
401 API key hilang atau tidak valid Verifikasi key dan wilayah endpoint
403 Tidak punya akses ke model Pastikan akun diaktifkan untuk tier preview
404 Model tidak ditemukan Cek ID model dan ketersediaan wilayah
429 Rate limit atau kuota habis Gunakan retry dengan backoff
500 / 503 Error server Retry dengan exponential backoff

Model preview lebih sering menghasilkan 403 atau 404 karena akses dibatasi dan ID model dapat berubah. Jika Anda mendapat error tersebut, kemungkinan masalahnya ada pada akses akun, wilayah, atau string model.

Contoh retry sederhana di Python:

import os
import time
from openai import OpenAI, RateLimitError, APIStatusError

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

def ask_qwen(prompt, max_retries=4):
    for attempt in range(max_retries):
        try:
            response = client.chat.completions.create(
                model="qwen3.7-max-preview",
                messages=[
                    {
                        "role": "user",
                        "content": prompt,
                    }
                ],
            )
            return response.choices[0].message.content

        except RateLimitError:
            wait = 2 ** attempt
            print(f"Rate limited. Retrying in {wait}s...")
            time.sleep(wait)

        except APIStatusError as e:
            print(f"API error {e.status_code}: {e.message}")
            raise

    raise RuntimeError("Failed after retries")
Enter fullscreen mode Exit fullscreen mode

Aturan praktis:

  • Retry untuk 429, 500, dan 503.
  • Jangan retry otomatis untuk 400, 401, 403, atau 404.
  • Gunakan exponential backoff agar aplikasi tidak membanjiri API.
  • Log status code, request ID jika tersedia, dan ID model yang dipakai.

Menguji dan membuat mock API Qwen dengan Apidog

API preview sulit diuji karena akses dapat dibatasi, ID model dapat berubah, dan rate limit bisa ketat. Daripada menjalankan seluruh aplikasi setiap kali, lebih praktis menguji endpoint secara terisolasi.

Apidog membantu Anda:

  • Membuat request ke endpoint Qwen.
  • Menyimpan skenario test.
  • Mengelola header seperti Authorization.
  • Mengganti environment antara mock dan DashScope.
  • Membuat mock server saat API asli belum stabil.

Apidog API testing

Workflow yang bisa dipakai:

  1. Buat request baru di Apidog.
  2. Set method ke POST.
  3. Gunakan endpoint:
   https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions
Enter fullscreen mode Exit fullscreen mode
  1. Tambahkan header:
   Authorization: Bearer {{DASHSCOPE_API_KEY}}
   Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode
  1. Tambahkan body:
   {
     "model": "qwen3.7-max-preview",
     "messages": [
       {
         "role": "user",
         "content": "Explain idempotency in REST APIs."
       }
     ]
   }
Enter fullscreen mode Exit fullscreen mode
  1. Simpan sebagai test case.
  2. Jalankan ulang saat ID model atau endpoint berubah.

Untuk kondisi ketika akses preview belum tersedia, buat mock endpoint dengan response realistis. Frontend atau agen Anda dapat dikembangkan terhadap mock server terlebih dahulu. Saat API langsung siap, ganti base URL dari mock ke DashScope tanpa mengubah struktur request.

Jika Anda memakai pendekatan schema-first, lihat panduan mode spec-first. Pola pengujian yang sama juga berlaku untuk API model lain seperti Gemini atau API ERNIE 5.1.

Kesimpulan

Memanggil Qwen 3.7 relatif sederhana jika Anda sudah tahu jalurnya:

  1. Coba prompt di Qwen Chat.
  2. Aktifkan Alibaba Cloud Model Studio.
  3. Ambil API key.
  4. Pilih base URL sesuai wilayah.
  5. Panggil /chat/completions dengan pola kompatibel OpenAI.
  6. Tambahkan streaming, reasoning control, retry, dan logging.
  7. Uji serta mock endpoint dengan Apidog sebelum integrasi produksi.

Berhenti menebak response API dan mulai validasi request secara langsung. Unduh Apidog untuk mendesain endpoint Qwen, mengirim request test, menyimpan skenario reusable, dan membuat mock API saat Anda membangun.

Top comments (0)