DEV Community

Cover image for Qwen 3.6 Tersedia di OpenRouter: Cara Menggunakannya Sekarang
Walse
Walse

Posted on • Originally published at apidog.com

Qwen 3.6 Tersedia di OpenRouter: Cara Menggunakannya Sekarang

INTINYA

Qwen 3.6 Plus Preview diluncurkan pada 30 Maret 2026, dengan jendela konteks 1 juta token, penalaran rantai pemikiran wajib, dan dukungan penggunaan alat. Model ini sepenuhnya gratis di OpenRouter saat ini. Gunakan ID model qwen/qwen3.6-plus-preview:free dengan klien yang kompatibel OpenAI untuk mulai mengirim permintaan hari ini.

Coba Apidog hari ini

Model yang Muncul Diam-diam

Alibaba Cloud meluncurkan Qwen 3.6 Plus Preview pada 30 Maret 2026. Tidak ada pengumuman besar, tanpa daftar tunggu. Model baru ini langsung tersedia di OpenRouter dengan harga $0 per juta token.

Qwen 3.6 Plus Preview

Dalam dua hari pertama, model ini memproses lebih dari 400 juta token dari sekitar 400.000 permintaan, dan para developer menyebutnya cepat.

Artikel ini memandu Anda mulai dari pengaturan akun, pembuatan kunci API, contoh kode cURL, Python, Node.js, hingga saran praktis penggunaan model.

💡 Jika Anda membangun di atas API AI, Anda butuh cara untuk menguji dan debug permintaan secara andal. Apidog menangani ini dengan baik—gratis dan bekerja dengan API REST apa pun, termasuk OpenRouter.

Pada akhir panduan ini, Anda akan tahu cara memanggil Qwen 3.6 gratis, memahami kemampuan dan keterbatasannya.

Apa yang Ditambahkan Qwen 3.6 Dibandingkan Seri 3.5

Lompatan dari 3.5 ke 3.6 signifikan pada tiga hal utama:

1. Jendela Konteks 1 Juta Token

Qwen 3.5 hanya 32K-128K token. Qwen 3.6 menerima input hingga 1 juta token (~750.000 kata). Anda bisa memasukkan basis kode penuh, log Slack setahun, atau korpus dokumen hukum besar dalam satu permintaan. Model gratis lain biasanya mentok di 8K-32K, jadi 1 juta token benar-benar luar biasa.

2. Penalaran Otomatis

Qwen 3.6 menghasilkan rantai pemikiran internal secara otomatis sebelum jawaban akhir. Tidak perlu prompt khusus seperti "think step by step". Ini berlaku untuk tugas coding, front-end, dan problem solving umum.

3. Perilaku Agen Lebih Andal

Pemanggilan alat pada Qwen 3.5 sering tidak konsisten. Qwen 3.6 memperbaikinya: lebih sedikit kesalahan dalam pemanggilan fungsi pada workflow multi-langkah.

Model ini optimal untuk:

  • Coding agen (pembuatan kode multi-langkah dengan alat)
  • Pengembangan front-end (HTML, CSS, JavaScript)
  • Analisis dan ringkasan konteks panjang

Cara Mengakses Qwen 3.6 Gratis

Langkah 1: Daftar Akun OpenRouter

Kunjungi openrouter.ai dan daftar menggunakan email/Google. Prosesnya kurang dari 2 menit, tanpa perlu kartu kredit. Setelah verifikasi email, Anda langsung dapat akses model gratis.

Langkah 2: Buat Kunci API

  1. Klik avatar profil di kanan atas
  2. Pilih Kunci API
  3. Klik Buat Kunci
  4. Beri nama (misal, qwen-test), klik Buat
  5. Salin kunci (sk-or-v1-...) dan simpan dengan aman.

Generate API Key

Langkah 3: Kirim Permintaan Pertama Anda

ID model: qwen/qwen3.6-plus-preview:free

Format permintaan sama seperti OpenAI API.

cURL:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer sk-or-v1-YOUR_KEY_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3.6-plus-preview:free",
    "messages": [
      {
        "role": "user",
        "content": "Write a Python function that parses a JWT token and returns the payload as a dictionary."
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

Python (requests):

import requests

def call_qwen(prompt: str, api_key: str) -> str:
    response = requests.post(
        "https://openrouter.ai/api/v1/chat/completions",
        headers={
            "Authorization": f"Bearer {api_key}",
            "Content-Type": "application/json",
        },
        json={
            "model": "qwen/qwen3.6-plus-preview:free",
            "messages": [{"role": "user", "content": prompt}],
        },
        timeout=60,
    )
    response.raise_for_status()
    return response.json()["choices"][0]["message"]["content"]

result = call_qwen(
    "Write a Python function that parses a JWT token and returns the payload.",
    api_key="sk-or-v1-YOUR_KEY_HERE"
)
print(result)
Enter fullscreen mode Exit fullscreen mode

Node.js (fetch):

async function callQwen(prompt, apiKey) {
  const response = await fetch("https://openrouter.ai/api/v1/chat/completions", {
    method: "POST",
    headers: {
      "Authorization": `Bearer ${apiKey}`,
      "Content-Type": "application/json",
    },
    body: JSON.stringify({
      model: "qwen/qwen3.6-plus-preview:free",
      messages: [{ role: "user", content: prompt }],
    }),
  });

  if (!response.ok) {
    throw new Error(`OpenRouter error: ${response.status} ${await response.text()}`);
  }

  const data = await response.json();
  return data.choices[0].message.content;
}

callQwen(
  "Write a JavaScript function that validates an email address.",
  "sk-or-v1-YOUR_KEY_HERE"
).then(console.log);
Enter fullscreen mode Exit fullscreen mode

Python dengan OpenAI SDK:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-YOUR_KEY_HERE",
)

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=[
        {
            "role": "system",
            "content": "You are a senior backend engineer. Write clean, production-ready code."
        },
        {
            "role": "user",
            "content": "Write a Python function that retries a failed HTTP request up to 3 times with exponential backoff."
        }
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Penggunaan Alat dan Alur Kerja Agen

Qwen 3.6 sangat baik untuk penggunaan alat (function calling), bahkan di tingkat gratis. Berikut contoh workflow:

from openai import OpenAI
import json

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-YOUR_KEY_HERE",
)

tools = [
    {
        "type": "function",
        "function": {
            "name": "search_api_docs",
            "description": "Search the API documentation for a specific endpoint or parameter",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {
                        "type": "string",
                        "description": "The search query"
                    },
                    "version": {
                        "type": "string",
                        "enum": ["v1", "v2", "v3"],
                        "description": "API version to search"
                    }
                },
                "required": ["query"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "run_api_test",
            "description": "Execute a test request against an API endpoint",
            "parameters": {
                "type": "object",
                "properties": {
                    "endpoint": {"type": "string"},
                    "method": {"type": "string", "enum": ["GET", "POST", "PUT", "DELETE"]},
                    "body": {"type": "object"}
                },
                "required": ["endpoint", "method"]
            }
        }
    }
]

messages = [
    {
        "role": "user",
        "content": "Find documentation for the /users endpoint and run a test GET request against it."
    }
]

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=messages,
    tools=tools,
    tool_choice="auto",
)

message = response.choices[0].message

if message.tool_calls:
    for tool_call in message.tool_calls:
        print(f"Tool: {tool_call.function.name}")
        args = json.loads(tool_call.function.arguments)
        print(f"Arguments: {json.dumps(args, indent=2)}")
else:
    print(message.content)
Enter fullscreen mode Exit fullscreen mode

Model akan mengembalikan panggilan fungsi terstruktur, bukan jawaban bebas. Anda eksekusi fungsi di kode Anda, dan kirim hasilnya di giliran berikutnya. Ini dasar alur kerja agen multi-langkah.

Memanfaatkan Jendela Konteks 1 Juta Token

Fitur ini relevan untuk kasus penggunaan berikut:

1. Tinjauan Basis Kode Besar

Masukkan basis kode penuh dan minta model:

import os
from pathlib import Path
from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-YOUR_KEY_HERE",
)

def load_codebase(directory: str, extensions: list[str]) -> str:
    content_parts = []
    for path in Path(directory).rglob("*"):
        if path.suffix in extensions and path.is_file():
            try:
                text = path.read_text(encoding="utf-8", errors="ignore")
                content_parts.append(f"--- FILE: {path} ---\n{text}\n")
            except Exception:
                continue
    return "\n".join(content_parts)

codebase = load_codebase("./src", [".py", ".js", ".ts"])

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=[
        {
            "role": "user",
            "content": f"Review this codebase and identify:\n1. Security vulnerabilities\n2. Functions with no error handling\n3. Inconsistent naming conventions\n\nCodebase:\n{codebase}"
        }
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

2. Analisis Dokumen Besar

Masukkan dokumen panjang dan ekstrak informasi spesifik:

with open("annual_report_2025.txt", "r") as f:
    document = f.read()

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=[
        {
            "role": "user",
            "content": f"Extract all mentions of API rate limits and pricing changes from this document:\n\n{document}"
        }
    ],
)
Enter fullscreen mode Exit fullscreen mode

3. Percakapan Multi-Giliran dengan Riwayat Lengkap

Simpan seluruh riwayat chat untuk sesi debugging panjang:

conversation = []

def chat(user_message: str) -> str:
    conversation.append({"role": "user", "content": user_message})

    response = client.chat.completions.create(
        model="qwen/qwen3.6-plus-preview:free",
        messages=conversation,
    )

    assistant_message = response.choices[0].message.content
    conversation.append({"role": "assistant", "content": assistant_message})
    return assistant_message

# Sesi debugging panjang
print(chat("I'm getting a 401 error from the GitHub API. Here's my code..."))
print(chat("I added the token but now I get a 403. The token has repo scope."))
print(chat("The repo is private. What scopes do I actually need?"))
Enter fullscreen mode Exit fullscreen mode

Menguji Permintaan API OpenRouter dengan Apidog

Debug permintaan API OpenRouter bisa memakan waktu jika hanya pakai terminal atau Postman.

Debug API dengan Apidog

Apidog adalah klien API gratis untuk membuat permintaan, inspeksi respons, dan otomatisasi pengujian.

Langkah praktis:

  1. Buat permintaan POST ke https://openrouter.ai/api/v1/chat/completions
  2. Tambahkan header Authorization: Bearer sk-or-v1-...
  3. Isi body JSON dengan field model dan messages
  4. Kirim permintaan dan cek respons

Anda bisa menyimpan permintaan sebagai koleksi, membandingkan output antar model, serta menulis tes yang memverifikasi struktur respons atau isi panggilan alat.

Jika Anda membangun aplikasi yang memanggil OpenRouter, tulis tes permintaan di Apidog dari awal untuk menghemat waktu debug.

Batas Tingkat Gratis yang Perlu Anda Ketahui

Batas Tarif Bersama

Semua pemakai model gratis berbagi kapasitas. Pada jam sibuk (malam waktu AS), Anda bisa kena rate limit atau latensi tinggi. Bangun retry logic pada kode produksi Anda.

import time
import requests
from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry

session = requests.Session()
retry_strategy = Retry(
    total=3,
    backoff_factor=2,
    status_forcelist=[429, 500, 502, 503, 504],
)
adapter = HTTPAdapter(max_retries=retry_strategy)
session.mount("https://", adapter)

response = session.post(
    "https://openrouter.ai/api/v1/chat/completions",
    headers={"Authorization": "Bearer sk-or-v1-YOUR_KEY_HERE"},
    json={
        "model": "qwen/qwen3.6-plus-preview:free",
        "messages": [{"role": "user", "content": "Hello"}],
    },
    timeout=30,
)
Enter fullscreen mode Exit fullscreen mode

Data Dicatat

OpenRouter menyatakan model ini mengumpulkan data prompt dan hasil. Jangan kirim API key, password, atau data sensitif.

Status Pratinjau

Model ini pratinjau: perilaku bisa berubah. Jika untuk produksi, pasang tes integrasi pada ID model dan pantau perubahan.

Hanya Teks

Qwen 3.6 hanya menerima dan mengeluarkan teks. Tidak ada support gambar, audio, atau upload file.

Kasus Penggunaan Dunia Nyata

  • Agen peninjau kode: Masukkan seluruh diff PR (10K+ baris) ke Qwen 3.6 dan dapatkan review logika, test, serta keamanan.
  • Pembuatan komponen front-end: Generate komponen React lengkap (TypeScript & CSS) langsung dari desain.
  • Ringkasan dokumentasi API: Input dokumentasi besar dua API berbeda, dan dapatkan perbandingan otentikasi, webhook, hingga rate limit dalam satu permintaan.

Daftar di openrouter.ai, ambil API key Anda, dan gunakan qwen/qwen3.6-plus-preview:free sebagai pengganti model berbayar Anda.

FAQ

Apakah Qwen 3.6 Benar-benar Gratis?

Ya. Per Maret 2026, $0 per juta token input/output di OpenRouter. Status gratis bisa berubah setelah masa pratinjau. Cek harga OpenRouter sebelum membangun aplikasi yang mengandalkan harga tetap nol.

Berapa Batas Tarif untuk Gratis?

OpenRouter tidak mempublikasikan batas pasti. Model gratis berbagi kapasitas. Mulai dengan satu permintaan per waktu dan tambahkan mekanisme retry sebelum meningkatkan concurrency.

Bisakah Dipakai untuk Proyek Komersial?

Ya, OpenRouter mengizinkan penggunaan komersial. Cek lisensi Qwen dari Alibaba Cloud untuk batasan distribusi output.

Kenapa Qwen 3.6 Lebih Lama Merespons?

Token penalaran wajib menambah latensi. Untuk prompt sederhana, delay beberapa detik. Untuk reasoning kompleks, latensi tambahan setara hasilnya. Gunakan streaming jika ingin output parsial.

Bisa Menonaktifkan Token Penalaran?

Saat ini, penalaran wajib dan tidak bisa dimatikan. Untuk kebutuhan cepat, gunakan model lain seperti LLaMA 3.1 8B.

Bagaimana Pengaruh Jendela 1 Juta Token ke Biaya?

Saat gratis, tidak berpengaruh. Anda tetap bayar $0, berapapun token yang dikirim. Untuk permintaan sangat besar, siapkan timeout minimal 30-60 detik.


Selamat mencoba Qwen 3.6 pada workflow Anda!

Top comments (0)