DEV Community

Cover image for Qwen 3.7 API Nasıl Kullanılır?
Tobias Hoffmann
Tobias Hoffmann

Posted on • Originally published at apidog.com

Qwen 3.7 API Nasıl Kullanılır?

Alibaba'nın Qwen ekibi, Qwen3.7-Max-Preview'u 2026 Mayıs ortasında yayınladı. Geliştiriciler için asıl soru şu: Bu modeli kendi uygulamamdan nasıl çağırırım? Model, 1 milyon tokenlık bağlam penceresi ve açık düşünce zinciri izleriyle ajan arka uçları, uzun belge analizi ve kod üretimi için güçlü bir muhakeme sistemi sunar. Ancak “Preview” etiketi önemlidir: erişim kısıtlı olabilir, API yüzeyi değişebilir ve doğru model kimliği/uç nokta bilgisi resmi belgelerden doğrulanmalıdır.

Apidog'u bugün deneyin

TL;DR

Qwen3.7-Max-Preview, Alibaba'nın 1 milyon tokenlık bağlam penceresine sahip amiral gemisi muhakeme modelidir ve 14 Mayıs 2026'da önizleme olarak yayınlanmıştır.

Bugün denemek için en hızlı yol Qwen Chat'tir. Üretim entegrasyonu için yol, Alibaba Cloud Model Studio yani DashScope üzerinden OpenAI uyumlu API kullanmaktır:

  • DashScope temel URL'sini ayarlarsınız.
  • API anahtarınızı Bearer token olarak gönderirsiniz.
  • /chat/completions endpoint'ini çağırırsınız.
  • Model kimliğini resmi Model Studio listesinden doğrularsınız.

Önizleme döneminde model kimliği ve erişim durumu değişebileceğinden, entegrasyondan önce endpoint'i test etmek ve gerekirse mocklamak için Apidog kullanmak pratik bir yaklaşımdır.

Qwen 3.7'ye şu anda nasıl erişilir

Qwen modelleri birden fazla yüzeyde sunulur. Her yüzey aynı anda açılmayabilir.

1. Qwen Chat

chat.qwen.ai, Qwen3.7-Max-Preview'u hızlıca denemek için en kolay yoldur.

Kullanım adımları:

  1. Ücretsiz Qwen hesabıyla oturum açın.
  2. Model seçicide qwen3.7-max-preview modelini seçin.
  3. Muhakeme izini görmek için Düşünme Modu'nu açın.
  4. İstemlerinizi tarayıcı üzerinden test edin.

Bu yöntem API değildir. Entegrasyon için değil, model davranışını hızlı değerlendirmek için uygundur.

2. Alibaba Cloud Model Studio / DashScope

Üretim API erişimi için kullanmanız gereken yüzey Model Studio'dur. DashScope, Qwen modellerini OpenAI uyumlu endpoint üzerinden sunar.

Bu şu anlama gelir:

  • OpenAI SDK kullanabilirsiniz.
  • Sadece base_url değerini DashScope endpoint'ine çevirirsiniz.
  • API anahtarını DashScope'tan alırsınız.
  • /chat/completions çağrısı yaparsınız.

qwen3.6-max-preview ve qwen-max ailesi gibi eski katmanlar Model Studio'da zaten kullanılabilir. Qwen3.7-Max-Preview için API erişimi, bunu okuduğunuz tarihte hâlâ kısıtlı olabilir.

Qwen Model Studio ekran görüntüsü

3. OpenAI uyumlu çağrı deseni

DashScope üzerindeki Qwen modellerinde genel istek şekli aynıdır:

POST {base_url}/chat/completions
Authorization: Bearer {DASHSCOPE_API_KEY}
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode

Gövde:

{
  "model": "qwen3.7-max-preview",
  "messages": [
    {
      "role": "user",
      "content": "Explain idempotency in REST APIs."
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode

Önizleme döneminde model kimliği değişebileceği için canlı model adını her zaman şu kaynaklardan doğrulayın:

API erişimi beklerken modeli ücretsiz denemek için ayrıca Qwen 3.7'yi ücretsiz kullanma rehberine bakabilirsiniz.

Erişim yöntemleri

Yöntem API erişimi Maliyet En uygun kullanım
Qwen Chat (chat.qwen.ai) Hayır Ücretsiz, oran sınırlamalı Hızlı değerlendirme, istem testi
Alibaba Cloud Model Studio / DashScope Evet, OpenAI uyumlu Token başına ödeme Üretim entegrasyonu
Hugging Face'de Qwen Ağırlıklar yayınlandığında Ücretsiz, kendi barındırmalı Açık ağırlıklı modeller
Üçüncü taraf ağ geçitleri Değişir Değişir Çoklu model yönlendirme

Önemli ayrım: Açık ağırlıklı Qwen modelleri Hugging Face'e gelebilir, ancak Max-Preview katmanı özeldir. Bu nedenle qwen3.7-max-preview için indirilebilir ağırlık beklemeyin.

Qwen 3.7 API anahtarı alma

API erişimi Alibaba Cloud hesabı üzerinden sağlanır.

Adımlar:

  1. Alibaba Cloud hesabı oluşturun.
  2. Model Studio konsolunu açın: modelstudio.console.alibabacloud.com
  3. Hesabınız ve bölgeniz için Model Studio'yu etkinleştirin.
  4. API anahtarları bölümünden yeni bir anahtar oluşturun.
  5. sk- ile başlayan anahtarı kopyalayın.
  6. Anahtarı parola gibi saklayın.

Bölge seçimi önemlidir. Anahtarlar bölge kapsamlıdır. Örneğin Singapur endpoint'i için oluşturulan anahtar Pekin endpoint'inde çalışmayabilir.

Bölge Temel URL
Singapur https://dashscope-intl.aliyuncs.com/compatible-mode/v1
ABD / Virginia https://dashscope-us.aliyuncs.com/compatible-mode/v1
Pekin / Çin https://dashscope.aliyuncs.com/compatible-mode/v1

API anahtarını kaynak koda yazmayın. Ortam değişkeni kullanın:

# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"
Enter fullscreen mode Exit fullscreen mode

Uygulamanız çalışma zamanında DASHSCOPE_API_KEY değerini okur. Böylece sırrı depoya koymazsınız ve anahtar rotasyonunu kod değiştirmeden yapabilirsiniz.

Aynı deseni Gemini 3.5 API rehberinde de görebilirsiniz.

İlk isteğiniz: Python, curl ve JavaScript

Qwen'in Model Studio endpoint'i OpenAI uyumludur. Bu yüzden iki pratik yol vardır:

  • OpenAI SDK kullanmak
  • Ham HTTP isteği göndermek

Aşağıdaki örneklerde qwen3.7-max-preview kullanılıyor. Önizleme döneminde kesin model kimliği değişebilir. Çalıştırmadan önce Model Studio model listesinden güncel değeri doğrulayın.

Python ile çağırma

Kurulum:

pip install openai
Enter fullscreen mode Exit fullscreen mode

Kod:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

response = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "system",
            "content": "You are a precise coding assistant."
        },
        {
            "role": "user",
            "content": "Write a Python function that reverses a linked list."
        },
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Burada:

  • base_url, seçtiğiniz DashScope bölgesine göre değişir.
  • model, Model Studio'daki canlı model kimliği olmalıdır.
  • messages, standart OpenAI sohbet formatını kullanır.
  • Yanıt metni response.choices[0].message.content alanındadır.

curl ile hızlı test

Uygulama kodu yazmadan önce anahtarın ve endpoint'in çalıştığını doğrulamak için:

curl 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions' \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "qwen3.7-max-preview",
    "messages": [
      {
        "role": "user",
        "content": "Explain idempotency in REST APIs in two sentences."
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

Başarılıysa JSON yanıtı içinde tamamlanmış metin alırsınız. Hata alırsanız genellikle sebep şunlardan biridir:

  • Yanlış API anahtarı
  • Yanlış bölge endpoint'i
  • Erişime kapalı model
  • Hatalı model kimliği
  • Kota veya oran limiti

JavaScript / Node.js ile çağırma

Kurulum:

npm install openai
Enter fullscreen mode Exit fullscreen mode

Kod:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const response = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [
    {
      role: "user",
      content: "List three trade-offs of GraphQL versus REST.",
    },
  ],
});

console.log(response.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Python, curl ve Node.js örneklerinin aynı istek şeklini kullanması OpenAI uyumlu API'nin ana avantajıdır.

Akış yanıtları

Kullanıcıya dönük uygulamalarda yanıtın tamamen bitmesini beklemek kötü bir deneyim oluşturur. Akış, token'ları üretildikçe gönderir.

Python örneği:

stream = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "user",
            "content": "Summarize the CAP theorem."
        },
    ],
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)
Enter fullscreen mode Exit fullscreen mode

Node.js örneği:

const stream = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [
    {
      role: "user",
      content: "Summarize the CAP theorem.",
    },
  ],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}
Enter fullscreen mode Exit fullscreen mode

Muhakeme modellerinde akış daha önemlidir. Qwen 3.7 nihai yanıta geçmeden önce düşünme aşamasında zaman harcayabilir. Akış kullanmazsanız kullanıcı boş ekran görür. Akış kullanırsanız:

  • Yazıyor göstergesi gösterebilirsiniz.
  • Yanıtı parça parça basabilirsiniz.
  • Düşünme izini görünür kılabilirsiniz.
  • Daha düşük algılanan gecikme sağlarsınız.

Muhakeme ve düşünme parametresi

Qwen3.7-Max-Preview bir muhakeme modelidir. Nihai yanıttan önce <think> blokları içinde açık düşünce zinciri üretebilir.

Bu özellik özellikle şu görevlerde yararlıdır:

  • Çok adımlı matematik
  • Karmaşık kod analizi
  • Ajan planlama
  • Uzun belge muhakemesi
  • Hata ayıklama

DashScope üzerinden sunulan son Qwen modellerinde düşünme davranışı enable_thinking benzeri bir bayrakla kontrol edilir. Ancak parametre adı ve davranış Qwen sürümüne göre değişebilir. Qwen 3.7 için kullanmadan önce güncel API referansını kontrol edin.

Kavramsal örnek:

response = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {
            "role": "user",
            "content": (
                "Bir tren öğleden sonra 2'de ortalama 60 mil/saat hızla kalkar. "
                "İkinci bir tren öğleden sonra 3'te aynı rotada 75 mil/saat hızla kalkar. "
                "İkinci tren birinciyi ne zaman yakalar?"
            ),
        },
    ],
    # Muhakeme kontrolleri Qwen sürümüne göre değişebilir.
    # Kullanmadan önce Model Studio API referansından doğrulayın.
    extra_body={
        "enable_thinking": True
    },
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Pratik karar kuralı:

  • Basit sınıflandırma, biçimlendirme veya kısa yanıtlar için düşünmeyi kapalı bırakın.
  • Matematik, planlama, karmaşık kod ve analiz için açın.
  • <think> içeriğini kullanıcıya gösterip göstermeyeceğinizi ürün seviyesinde belirleyin.
  • Düşünme token ve gecikme maliyeti ekler.

Muhakeme kalitesi ve maliyeti açısından diğer modellerle karşılaştırma yapmak isterseniz Qwen 3.7, GPT-5.5 ve Opus 4.7 karşılaştırmasına bakabilirsiniz.

Ajan döngülerinde token maliyeti hızla artabilir. Bu durumda ajan token maliyetlerini azaltma rehberindeki teknikler doğrudan uygulanabilir.

Hata yönetimi ve oran limitleri

Qwen API çağrıları öngörülebilir sebeplerle başarısız olabilir. Uygulamanızda bu hataları açıkça ele alın.

HTTP durumu Anlamı Ne yapmalı
400 Hatalı istek, bozuk JSON, geçersiz parametre Gövdeyi, model kimliğini ve alan adlarını kontrol edin
401 Eksik veya geçersiz API anahtarı Anahtarı ve bölge uyumunu doğrulayın
403 Modele erişim yok Önizleme erişiminizin açık olduğunu kontrol edin
404 Model bulunamadı Model kimliğini ve bölge desteğini doğrulayın
429 Oran limiti veya kota aşıldı Geri çekilme ile tekrar deneyin
500 / 503 Sunucu tarafı hata Üstel geri çekilme ile tekrar deneyin

Önizleme modellerinde 403 ve 404 daha sık görülebilir. Bu genellikle kod hatası değil, erişim veya model adı problemidir.

Python'da basit retry örneği:

import os
import time
from openai import OpenAI, RateLimitError, APIStatusError

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

def ask_qwen(prompt, max_retries=4):
    for attempt in range(max_retries):
        try:
            response = client.chat.completions.create(
                model="qwen3.7-max-preview",
                messages=[
                    {
                        "role": "user",
                        "content": prompt
                    }
                ],
            )
            return response.choices[0].message.content

        except RateLimitError:
            wait = 2 ** attempt
            print(f"Oran sınırı aşıldı. {wait} saniye içinde tekrar deneniyor...")
            time.sleep(wait)

        except APIStatusError as e:
            # 400/401/403/404 genellikle retry ile düzelmez.
            print(f"API hatası {e.status_code}: {e.message}")
            raise

    raise RuntimeError("Tekrar denemelerden sonra başarısız oldu")
Enter fullscreen mode Exit fullscreen mode

Uygulama mantığı olarak:

  • 429 ve 5xx için retry yapın.
  • 400, 401, 403, 404 için hızlı başarısız olun.
  • Sabit oran limiti varsaymayın; hesabınızın konsoldaki limitlerini kontrol edin.
  • Önizleme modellerinde fallback model veya mock endpoint kullanın.

Apidog ile Qwen API'sini test etme ve mocklama

Önizleme API'lerinde en büyük sorun modelin kendisi değil, entegrasyon belirsizliğidir:

  • Model kimliği değişebilir.
  • Erişim hesabınıza açılmamış olabilir.
  • Oran limitleri sıkı olabilir.
  • Endpoint geçici olarak kararsız olabilir.
  • Hata gövdeleri üretim akışınızı bozabilir.

Bu yüzden API'yi doğrudan uygulama içinde denemek yerine önce ayrı bir araçta izole etmek daha güvenlidir. Apidog, bu test ve mocklama döngüsü için kullanılabilir.

Apidog ile API testi

Pratik akış:

  1. Apidog'da yeni bir istek oluşturun.
  2. Method olarak POST seçin.
  3. URL olarak DashScope endpoint'ini girin:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions
Enter fullscreen mode Exit fullscreen mode
  1. Header ekleyin:
Authorization: Bearer {{DASHSCOPE_API_KEY}}
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode
  1. Body ekleyin:
{
  "model": "qwen3.7-max-preview",
  "messages": [
    {
      "role": "user",
      "content": "Explain how rate limiting should work in an API gateway."
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode
  1. Yanıtı kaydedin.
  2. Başarılı ve hatalı senaryoları ayrı örnekler olarak saklayın.
  3. Gerçek endpoint kullanılamıyorsa aynı şemadan mock endpoint üretin.

Mock endpoint özellikle önizleme modellerinde değerlidir. Gerçek Qwen API hesabınız için henüz açık değilse bile frontend'iniz veya ajan arka ucunuz beklenen JSON yapısına karşı geliştirilebilir. Canlı API hazır olduğunda sadece temel URL'yi mock sunucudan DashScope'a çevirirsiniz.

Şema öncelikli iş akışları için Apidog şema öncelikli mod rehberine bakabilirsiniz.

Aynı test ve mocklama deseni Qwen dışında Gemini veya ERNIE 5.1 API için de uygulanabilir.

Sonuç

Qwen 3.7'yi çağırmanın uygulama tarafı basittir:

  1. DashScope API anahtarı alın.
  2. Bölgenize uygun base_url seçin.
  3. Model kimliğini resmi listeden doğrulayın.
  4. OpenAI uyumlu /chat/completions endpoint'ini çağırın.
  5. Akış, retry ve hata yönetimini ekleyin.
  6. Önizleme belirsizliği için Apidog ile test ve mock akışı kurun.

Asıl zorluk API şekli değil, önizleme erişimidir. Bu yüzden entegrasyonu doğrudan üretim koduna gömmek yerine önce endpoint'i test edin, yanıtları kaydedin ve mock senaryolarla geliştirme ortamınızı kararlı tutun.

Qwen endpoint'ini tasarlamak, test istekleri göndermek, tekrar kullanılabilir senaryoları kaydetmek ve geliştirme sırasında API'yi mocklamak için Apidog'u indirin.

Top comments (0)