DEV Community

Cover image for Qwen3.6-Plus API: Terminalde Claude'u Geçti
Tobias Hoffmann
Tobias Hoffmann

Posted on • Originally published at apidog.com

Qwen3.6-Plus API: Terminalde Claude'u Geçti

Özetle

Qwen3.6-Plus resmi olarak piyasada. SWE-bench Verified'da %78,8 ve Terminal-Bench 2.0'da %61,6 puanla Claude Opus 4.5'i geçti. 1 milyon token bağlam penceresi, ajan döngüleri için yeni bir preserve_thinking parametresi ve OpenAI uyumlu API ile doğrudan Claude Code, OpenClaw ve Qwen Code ile çalışabiliyor.

Apidog'u hemen deneyin

Önizlemeden tam sürüme

OpenRouter'daki Qwen 3.6 Plus Önizleme rehberimizi okuduysanız, modelin neler sunabildiğini görmüşsünüzdür. Önizleme 30 Mart'ta bekleme listesi olmadan ve OpenRouter üzerinden ücretsiz olarak yayınlandı. İlk iki günde, yaklaşık 400.000 istekte 400 milyondan fazla tamamlama tokenı işlendi.

Resmi sürüm, kararlı API, SLA destekli çalışma süresi ve çok adımlı ajan görevleri için yeni API parametresiyle birlikte geliyor. Artık sadece önizleme değil, doğrudan üretimde kullanılabilir bir model.

Bu rehberde, değişiklikleri, API'nin en iyi şekilde nasıl çağrılacağını ve dağıtımdan önce Apidog ile entegrasyonun nasıl test edileceğini bulacaksınız.

Qwen3.6-Plus Nedir?

Qwen3.6-Plus, Alibaba'nın Qwen ekibinden barındırılan bir MoE (Mixture of Experts) modelidir. Qwen3.5 serisi gibi seyrek aktivasyon kullanır, yani token başına parametrelerin yalnızca bir kısmı çalışır. Bu da benzer güce sahip yoğun modellere göre daha düşük hesaplama maliyeti sunar.

Başlıca özellikleri:

  • 1 milyon token bağlam penceresi
  • Zorunlu düşünce zinciri muhakemesi
  • Ajan görevleri için yeni preserve_thinking parametresi
  • Yerel çok modlu destek (görü, video, belge anlama)
  • OpenAI, Anthropic ve OpenAI Yanıtları API uyumluluğu

Açık kaynaklı daha küçük varyantlar kısa sürede geliyor. Kendi başınıza barındırmak için ağırlıklar yakında erişilebilir olacak.

Kıyaslama Sonuçları

Kodlama ajanları

Qwen3.6-Plus, SWE-bench görevlerinde Claude Opus 4.5'in az farkla arkasında kalsa da terminal operasyonlarında tüm rakiplerini geride bırakıyor.

Terminal-Bench 2.0 Karşılaştırması

Terminal-Bench 2.0, gerçek kabuk komutlarını, dosya yönetimini, süreç kontrolünü ve çok adımlı iş akışlarını test eder. %61,6 puan ile Claude Opus 4.5'in %59,3'üne kıyasla geliştirici dostu bir fark yaratıyor.

Genel ajanlar ve araç kullanımı

Kıyaslama Claude Opus 4.5 Qwen3.6-Plus
TAU3-Bench 70.2% 70.7%
DeepPlanning 33.9% 41.5%
MCPMark 42.3% 48.2%
MCP-Atlas 71.8% 74.1%
WideSearch 76.4% 74.3%

MCPMark, GitHub MCP v0.30.3 araç çağrılarını test eder. Qwen3.6-Plus'ın %48,2 ile liderliği, MCP tabanlı araçlar geliştirenler için avantaj sağlar. DeepPlanning'de de uzun vadeli planlama görevlerinde ciddi bir üstünlük var.

Muhakeme ve bilgi

Kıyaslama Claude Opus 4.5 Qwen3.6-Plus
GPQA 87.0% 90.4%
LiveCodeBench v6 84.8% 87.1%
IFEval strict 90.9% 94.3%
MMLU-Pro 89.5% 88.5%

Qwen3.6-Plus, GPQA ve IFEval strict gibi karmaşık muhakeme ve biçimlendirme görevlerinde önde. Bu, yapılandırılmış çıktı gerektiren ajan görevlerinde avantaj sağlar.

Çok Modlu

Kıyaslama Qwen3.6-Plus Notlar
OmniDocBench 1.5 91.2% Tablo lideri
RefCOCO ort 93.5% Tablo lideri
We-Math 89.0% Tablo lideri
CountBench 97.6% Tablo lideri
OSWorld-Verified 62.5% Claude %66,3 ile önde

Belge anlama ve mekansal temellendirme görevlerinde Qwen3.6-Plus önde. OSWorld-Verified'da ise Claude önde.

API Nasıl Çağrılır?

Qwen3.6-Plus, Alibaba Cloud Model Studio'da barındırılıyor. API anahtarınızı modelstudio.alibabacloud.com adresinden alın.

Bölgesel temel URL'ler:

  • Singapur: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
  • Pekin: https://dashscope.aliyuncs.com/compatible-mode/v1
  • ABD Virginia: https://dashscope-us.aliyuncs.com/compatible-mode/v1

Akışlı Temel Çağrı

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen3.6-plus",
    messages=[{"role": "user", "content": "Review this Python function and find bugs."}],
    extra_body={"enable_thinking": True},
    stream=True
)

reasoning = ""
answer = ""
is_answering = False

for chunk in completion:
    if not chunk.choices:
        continue
    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content:
        if not is_answering:
            reasoning += delta.reasoning_content
    if delta.content:
        if not is_answering:
            is_answering = True
        answer += delta.content
        print(delta.content, end="", flush=True)
Enter fullscreen mode Exit fullscreen mode

preserve_thinking Parametresi

Resmi sürümde gelen preserve_thinking parametresiyle, model konuşmadaki tüm önceki adımlardan muhakemeyi korur. Özellikle çok adımlı ajan görevlerinde kullanılmalı.

completion = client.chat.completions.create(
    model="qwen3.6-plus",
    messages=conversation_history,
    extra_body={
        "enable_thinking": True,
        "preserve_thinking": True, # tüm adımlarda muhakemeyi sakla
    },
    stream=True
)
Enter fullscreen mode Exit fullscreen mode

Qwen3.6-Plus'ı Claude Code ile Kullanmak

Qwen API'si Anthropic protokolünü destekler. Sadece ortam değişkenlerini ayarlayarak Claude Code'u Qwen3.6-Plus'a yönlendirebilirsiniz.

npm install -g @anthropic-ai/claude-code

export ANTHROPIC_MODEL="qwen3.6-plus"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-plus"
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=your_dashscope_api_key

claude
Enter fullscreen mode Exit fullscreen mode

Qwen3.6-Plus'ı OpenClaw ile Kullanmak

OpenClaw (eski adıyla Moltbot / Clawdbot), açık kaynak kodlama ajanıdır. Kurulum ve yapılandırma:

# Kurulum (Node.js 22+)
curl -fsSL https://molt.bot/install.sh | bash

export DASHSCOPE_API_KEY=your_key
openclaw dashboard
Enter fullscreen mode Exit fullscreen mode

~/.openclaw/openclaw.json dosyasına aşağıdakileri ekleyin (mevcut dosyanın üzerine yazmayın):

{
  "models": {
    "providers": [{
      "name": "alibaba-coding-plan",
      "baseUrl": "https://coding-intl.dashscope.aliyuncs.com/v1",
      "apiKey": "${DASHSCOPE_API_KEY}",
      "models": [{"id": "qwen3.6-plus", "reasoning": true}]
    }]
  },
  "agents": {
    "defaults": {"models": ["qwen3.6-plus"]}
  }
}
Enter fullscreen mode Exit fullscreen mode

Qwen3.6-Plus'ı Qwen Code ile Kullanmak

Qwen Code, Qwen serisi için Alibaba'nın geliştirdiği açık kaynak terminal ajanıdır. Günde 1.000 ücretsiz API çağrısı sunar.

npm install -g @qwen-code/qwen-code@latest
qwen
# Giriş yapmak ve ücretsiz katmanı etkinleştirmek için /auth yazın
Enter fullscreen mode Exit fullscreen mode

preserve_thinking Ajanın Davranışını Nasıl Değiştirir?

Çoğu LLM API'si her adımı bağımsız işler. Model bir yanıt üretir, muhakeme atılır ve bir sonraki adım sıfırdan başlar. Basit Soru-Cevap için bu sorun değildir. Ancak çok adımlı ajan görevlerinde, model önceki kararlarını göremediğinden sapmalar olur.

preserve_thinking parametresi aktifleştirildiğinde, model tüm önceki adımlardan gelen düşünce zincirini görür. Böylece, ajan 8. adımda çalışırken 2, 4 ve 6. adımlardaki kendi analizini inceleyebilir. Bu, daha tutarlı ve verimli kararlar alınmasını sağlar, gereksiz muhakemeyi azaltır ve token kullanımını optimize eder.

Çok adımlı ajanlar için bu örnek kod yapısını kullanın:

conversation = []

def agent_step(user_message, preserve=True):
    conversation.append({"role": "user", "content": user_message})

    response = client.chat.completions.create(
        model="qwen3.6-plus",
        messages=conversation,
        extra_body={
            "enable_thinking": True,
            "preserve_thinking": preserve,
        },
        stream=False
    )

    message = response.choices[0].message
    conversation.append({"role": "assistant", "content": message.content})
    return message.content

# Örnek: çok adımlı kod inceleme ajanı
result = agent_step("Analyze the auth module for security issues.")
result = agent_step("Now suggest fixes for the top 3 issues you found.")
result = agent_step("Write tests that validate each fix.")
Enter fullscreen mode Exit fullscreen mode

preserve_thinking olmadan, 3. adımda model 1. adımda hangi sorunları bulduğunu bilmez. Bu parametre ile muhakeme zinciri bozulmadan korunur.

En İyi Olduğu Alanlar

  • Depo düzeyinde hata düzeltme: SWE-bench Verified'da %78,8 ve SWE-bench Pro'da %56,6. Otomatik kod onarımı veya inceleme süreçleri için ciddi bir rakip.
  • Terminal otomasyonu: Terminal-Bench 2.0'daki liderliğiyle kabuk yoğun iş akışlarında öne çıkıyor.
  • MCP araç çağrısı: MCPMark'ta %48,2 ile MCP tabanlı entegrasyonlar için en iyi seçenek.
  • Uzun bağlamlı belge analizi: 1 milyon token pencere ile büyük kod tabanı ve belge analizleri tek çağrıda.
  • Ön uç kod üretimi: QwenWebBench'te Claude ile başa baş.
  • Çok dilli: WMT24++'da %84,3; 23 dilde MAXIFE'de %88,2. İngilizce dışı kullanımda güçlü.

Apidog ile Qwen3.6-Plus API Çağrılarını Test Etme

OpenAI uyumlu uç nokta sayesinde Qwen3.6-Plus'ı doğrudan Apidog'a aktararak diğer API'ler gibi test edebilirsiniz.

Apidog ile Qwen3.6-Plus API Testi

https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions adresine POST isteği gönderin. API anahtarınızı ortam değişkeni olarak ekleyin: Authorization: Bearer {{DASHSCOPE_API_KEY}}

Yanıtları doğrulamak için aşağıdaki testleri uygulayın:

pm.test("Yanıt seçenekler içeriyor", () => {
  const body = pm.response.json();
  pm.expect(body).to.have.property("choices");
  pm.expect(body.choices[0].message.content).to.be.a("string").and.not.empty;
});

pm.test("Düşünme etkinleştirildiğinde boş muhakeme yok", () => {
  const choice = pm.response.json().choices[0];
  if (choice.message.reasoning_content !== undefined) {
    pm.expect(choice.message.reasoning_content).to.not.be.empty;
  }
});
Enter fullscreen mode Exit fullscreen mode

Geliştirme sırasında test yanıtları üretmek için Apidog'un Akıllı Sahte (Smart Mock) özelliğini kullanın. Böylece ajan orkestrasyon kodunuzu gerçek API'ye istek atmadan test edebilir, token maliyetini düşürürsünüz.

Çok adımlı ajan geliştiriyorsanız, Apidog'da bir Test Senaryosu oluşturarak birden fazla isteği zincirleyin. Her adımda yanıt yapısını kontrol ederek preserve_thinking parametresinin işleyişini doğrulayın.

Apidog'u ücretsiz indirin ve API entegrasyon testlerinizi hemen başlatın.

Sırada Ne Var?

Qwen ekibi, daha küçük açık kaynak varyantları birkaç gün içinde yayımlayacağını duyurdu. Bunlar Qwen3.5 modelini takip edecek ve Apache 2.0 lisanslı, seyrek MoE tabanlı olacak.

Yol haritasında:

  • Daha uzun vadeli, çok dosyalı sorun çözme odaklı depo görevleri
  • GUI ajanları ve görsel kodlamanın birinci sınıf yetenek olarak geliştirilmesi

Qwen3.5 açık kaynak varyantları, piyasaya çıktıktan kısa süre sonra en çok dağıtılan self-host modellerden olmuştu. Qwen3.6 varyantları da muhtemelen kısa sürede kodlama ajanlarında varsayılan haline gelecek.

Sonuç

Qwen3.6-Plus, kodlama görevlerinde Claude Opus 4.5 ile aradaki farkı kapatıyor ve terminal operasyonları, MCP araç çağrısı, uzun vadeli planlama gibi alanlarda öne çıkıyor. 1 milyon token bağlam, Anthropic protokol uyumluluğu ve ajan döngüleri için preserve_thinking özelliğiyle, üretim ajan sistemleri için son derece pratik bir seçenek.

OpenRouter'daki ücretsiz önizleme değerlendirme için iyi bir fırsattı. Artık resmi API ile istikrar, SLA kapsamı ve çok adımlı iş akışlarını güvenilirleştiren yeni ajan parametrelerini kullanabilirsiniz.

Apidog ile testlerinizi yönetin: OpenAI uyumlu uç noktayı ekleyin, yanıt onaylamaları yazın, geliştirirken sahte verilerle hızlı test yapın ve model veya API sürümü değiştikçe regresyon kontrollerinizi eksiksiz uygulayın.

Sıkça Sorulan Sorular

Qwen3.6-Plus ile önizleme arasındaki fark nedir?

Önizleme (qwen/qwen3.6-plus-preview) 30 Mart 2026'da OpenRouter'da yayınlandı. Resmi sürüm preserve_thinking parametresi, SLA destekli çalışma süresi ve tam Model Studio desteği getiriyor. Daha küçük açık kaynak varyantlar da yolda.

preserve_thinking nedir ve ne zaman kullanmalıyım?

Varsayılan olarak yalnızca mevcut adımdaki muhakeme tutulur. preserve_thinking: true ayarlandığında, model tüm önceki konuşmadaki muhakeme zincirini korur. Çok adımlı ajan döngülerinde kullanın.

Qwen3.6-Plus, Claude Opus 4.5 ile nasıl karşılaştırılır?

Claude Opus 4.5, SWE-bench Verified (%80,9 vs %78,8) ve OSWorld-Verified (%66,3 vs %62,5) kıyaslamalarında önde. Qwen3.6-Plus ise Terminal-Bench 2.0 (%61,6 vs %59,3), MCPMark (%48,2 vs %42,3), DeepPlanning (%41,5 vs %33,9) ve GPQA (%90,4 vs %87,0) gibi alanlarda lider.

Qwen3.6-Plus'ı Claude Code ile kullanabilir miyim?

Evet. ANTHROPIC_BASE_URL'i Dashscope Anthropic uyumlu uç noktaya, ANTHROPIC_MODEL'i qwen3.6-plus'a ve ANTHROPIC_AUTH_TOKEN'ı Dashscope API anahtarınıza ayarlayın.

Qwen3.6-Plus açık kaynak mı?

Barındırılan API modeli açık ağırlıklı değil. Halka açık ağırlıklara sahip daha küçük varyantlar ise birkaç gün içinde yayınlanacak.

Ücretsiz erişimi nasıl edinebilirim?

Qwen Code'u kurun (npm install -g @qwen-code/qwen-code@latest), qwen komutunu çalıştırın ve /auth yazın. Günde 1.000 ücretsiz API çağrısı için Qwen Code OAuth ile giriş yapın.

Hangi bağlam penceresini destekler?

Varsayılan olarak 1 milyon token. Bazı kıyaslamalar karşılaştırma için 256K ile sınırlı, fakat API'da varsayılan 1M.

Dağıtımdan önce API entegrasyonunu nasıl test ederim?

Uç noktayı Apidog'a aktarın, API anahtarınızı ortam değişkeni olarak ekleyin, yanıt onaylamaları yazın ve geliştirme sırasında Akıllı Sahte (Smart Mock) özelliğini kullanın. Çok adımlı ajan davranışını uçtan uca test etmek için istekleri Test Senaryosu'nda zincirleyin.

Top comments (0)