DEV Community

Cover image for Cách sử dụng API Qwen 3.7 Plus
Sebastian Petrus
Sebastian Petrus

Posted on • Originally published at apidog.com

Cách sử dụng API Qwen 3.7 Plus

Qwen 3.7 Plus là mô hình tác tử đa phương thức của Alibaba: nhận văn bản, hình ảnh và video, hỗ trợ ngữ cảnh 1M token và có mức giá thấp hơn đáng kể so với dòng Max. Vì mô hình chỉ được cung cấp qua API, bài viết này tập trung vào các bước triển khai thực tế: lấy khóa API, gửi request đầu tiên, truyền hình ảnh/video, ước tính chi phí và kiểm thử bằng Apidog.

Thử Apidog ngay hôm nay

Bạn sẽ dùng Alibaba Cloud Model Studio để gọi endpoint tương thích OpenAI, sau đó có thể dùng Apidog để kiểm thử request, xem JSON thô, quản lý biến môi trường và mock endpoint trong khi ứng dụng đang được xây dựng. Nếu cần xem trước năng lực của mô hình, hãy đọc tổng quan về Qwen 3.7 Plus; nếu bạn cần bản chỉ văn bản, xem hướng dẫn API Qwen 3.7 cơ bản.

Tóm tắt triển khai

Qwen 3.7 Plus chạy qua Alibaba Cloud Model Studio, còn gọi là DashScope, trên endpoint tương thích OpenAI. Cấu hình cơ bản gồm:

  • Base URL theo khu vực
  • API key dạng Bearer token
  • Endpoint /chat/completions
  • Model ID: qwen3.7-plus
  • Payload đa phương thức bằng mảng content trong message

Giá tham chiếu:

Loại token Giá
Input 0,40 đô la / 1M token
Output 1,60 đô la / 1M token
Cached input 0,08 đô la / 1M token

Không có gói miễn phí vĩnh viễn. Tài khoản Model Studio mới có thể nhận hạn ngạch miễn phí một lần để đánh giá. Hình ảnh và video được quy đổi thành token, dùng chung ngân sách ngữ cảnh 1M token, nên payload thị giác sẽ ảnh hưởng trực tiếp đến chi phí.

Trước khi triển khai production, hãy xác nhận model ID hiện tại trong tài liệu Model Studio vì định danh có thể thay đổi.

Cách truy cập Qwen 3.7 Plus

Qwen 3.7 Plus có hai bề mặt sử dụng chính.

1. Qwen Chat

Truy cập chat.qwen.ai, đăng nhập, chọn mô hình Plus và thử với ảnh chụp màn hình hoặc prompt văn bản.

Dùng cách này khi bạn muốn:

  • Kiểm tra nhanh chất lượng phản hồi
  • Thử khả năng hiểu ảnh
  • Đánh giá mô hình trước khi viết code

Không dùng cách này cho tích hợp API.

2. Alibaba Cloud Model Studio / DashScope

Đây là API chính thức để tích hợp vào ứng dụng. Model Studio cung cấp endpoint tương thích OpenAI, nên bạn có thể dùng OpenAI SDK và chỉ cần thay:

  • base_url
  • api_key
  • model

Giới hạn quan trọng

Qwen 3.7 Plus là mô hình đóng. Không có trọng số mở để tải xuống, tự host hoặc chạy offline. Nếu self-host là yêu cầu bắt buộc, Plus không phù hợp. Xem thêm tổng quan về Qwen 3.7 Plus.

Phương pháp Truy cập API Chi phí Phù hợp cho
Qwen Chat (chat.qwen.ai) Không Miễn phí, có giới hạn tốc độ Đánh giá nhanh với hình ảnh
Model Studio / DashScope Có, tương thích OpenAI Trả theo token Tích hợp production
Tự host Không Không áp dụng Không khả dụng vì trọng số đóng

Lấy API key Qwen 3.7 Plus

Thực hiện các bước sau trong Alibaba Cloud:

  1. Tạo tài khoản Alibaba Cloud.
  2. Mở bảng điều khiển Model Studio tại modelstudio.console.alibabacloud.com.
  3. Kích hoạt Model Studio cho tài khoản và khu vực của bạn.
  4. Vào phần API key và tạo khóa mới.
  5. Sao chép khóa một lần và lưu như mật khẩu.

Khóa thường có dạng:

sk-...
Enter fullscreen mode Exit fullscreen mode

Lưu ý: API key bị ràng buộc theo khu vực. Ví dụ, key tạo ở Singapore sẽ không xác thực được với endpoint Bắc Kinh.

Chọn base URL theo khu vực

Khu vực Base URL
Singapore https://dashscope-intl.aliyuncs.com/compatible-mode/v1
Hoa Kỳ, Virginia https://dashscope-us.aliyuncs.com/compatible-mode/v1
Bắc Kinh, Trung Quốc https://dashscope.aliyuncs.com/compatible-mode/v1

Đặt key trong biến môi trường thay vì hard-code vào source code.

# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"
Enter fullscreen mode Exit fullscreen mode

Gửi request đầu tiên

Endpoint tương thích OpenAI, nên bạn có thể gọi bằng OpenAI SDK hoặc HTTP thô.

Endpoint:

POST /chat/completions
Enter fullscreen mode Exit fullscreen mode

Model:

qwen3.7-plus
Enter fullscreen mode Exit fullscreen mode

Hãy kiểm tra lại model ID trong danh sách mô hình Model Studio trước khi deploy.

Python với OpenAI SDK

Cài SDK:

pip install openai
Enter fullscreen mode Exit fullscreen mode

Code mẫu:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": "Tóm tắt mô hình định giá Qwen 3.7 Plus trong hai câu."
        }
    ],
)

print(resp.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Nếu bạn dùng khu vực khác, đổi base_url theo bảng ở trên.

curl

curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
  -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.7-plus",
    "messages": [
      {
        "role": "user",
        "content": "Xin chào từ API Qwen 3.7 Plus."
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

JavaScript

Cài SDK:

npm install openai
Enter fullscreen mode Exit fullscreen mode

Code mẫu:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const resp = await client.chat.completions.create({
  model: "qwen3.7-plus",
  messages: [
    {
      role: "user",
      content: "Xin chào từ API Qwen 3.7 Plus.",
    },
  ],
});

console.log(resp.choices[0].message.content);
Enter fullscreen mode Exit fullscreen mode

Gửi hình ảnh

Điểm khác biệt chính của Qwen 3.7 Plus so với Max là hỗ trợ đầu vào đa phương thức. Với hình ảnh, bạn truyền content dưới dạng mảng gồm nhiều phần: text và image.

Ví dụ Python:

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Nút nào gửi biểu mẫu này? Trả về tọa độ pixel."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://example.com/screenshot.png"
                    }
                },
            ],
        }
    ],
)

print(resp.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

Bạn có thể dùng:

  • URL ảnh công khai
  • URI dữ liệu base64

Ví dụ với base64:

import base64
import mimetypes

image_path = "screenshot.png"
mime_type = mimetypes.guess_type(image_path)[0] or "image/png"

with open(image_path, "rb") as f:
    image_base64 = base64.b64encode(f.read()).decode("utf-8")

data_url = f"data:{mime_type};base64,{image_base64}"

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Phân tích ảnh chụp màn hình này và chỉ ra nút đăng nhập."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": data_url
                    }
                },
            ],
        }
    ],
)
Enter fullscreen mode Exit fullscreen mode

Cách này hữu ích khi ảnh nằm trong máy local hoặc pipeline CI/CD.

Gửi video

Video cũng dùng cùng ý tưởng: thêm phần video vào content. Tuy nhiên tên field chính xác có thể khác theo khu vực hoặc phiên bản schema, nên hãy kiểm tra tài liệu tương thích OpenAI của DashScope trước khi triển khai.

Về mặt thiết kế hệ thống, nên xử lý video theo các bước:

  1. Giới hạn độ dài video.
  2. Lấy mẫu khung hình thay vì gửi toàn bộ.
  3. Giảm độ phân giải khi không cần chi tiết pixel cao.
  4. Gửi prompt rõ ràng về tác vụ cần phân tích.

Ví dụ prompt:

Phân tích các khung hình video và liệt kê các bước người dùng đã thực hiện trong giao diện.
Trả về JSON gồm: action, target, timestamp.
Enter fullscreen mode Exit fullscreen mode

Với tác tử GUI, bạn có thể yêu cầu mô hình trả về hành động có cấu trúc, ví dụ:

click at (x=487, y=232)
Enter fullscreen mode Exit fullscreen mode

hoặc:

{
  "action": "click",
  "x": 487,
  "y": 232,
  "target": "Submit button"
}
Enter fullscreen mode Exit fullscreen mode

Giá Qwen 3.7 Plus

Qwen 3.7 Plus được định giá như một mô hình đa phương thức tiết kiệm.

Mô hình Input / 1M token Output / 1M token Cached input / 1M token
Qwen 3.7 Plus 0,40 đô la 1,60 đô la 0,08 đô la
Qwen 3.7 Max 2,50 đô la 7,50 đô la 0,25 đô la

Plus rẻ hơn khoảng sáu lần so với Max ở chiều input. Không có gói miễn phí vĩnh viễn, nhưng tài khoản Model Studio mới có thể nhận hạn ngạch token miễn phí một lần, thường ở khu vực Singapore.

Đường dẫn miễn phí Qwen OAuth cũ đã ngừng hoạt động vào ngày 15 tháng 4 năm 2026, nên không nên xây dựng luồng tích hợp dựa trên cơ chế đó.

Tham khảo thêm:

Ước tính chi phí request

Văn bản thường rất rẻ. Chi phí tăng đáng kể khi bạn gửi ảnh lớn hoặc video vì nội dung thị giác được quy đổi thành token input.

Yêu cầu Token input Token output Chi phí ước tính
Prompt chỉ văn bản 10.000 2.000 ~0,007 đô la
Một ảnh chụp màn hình 1080p + prompt ~1.500 300 ~0,001 đô la
Video 30 giây, lấy mẫu 2 khung hình/giây ~77.000 500 ~0,032 đô la

Các con số này chỉ là ước tính. Token thực tế phụ thuộc vào độ phân giải, số khung hình, cách nén và schema xử lý của API.

Để kiểm soát chi phí:

  • Resize ảnh trước khi gửi.
  • Crop vùng giao diện liên quan thay vì gửi toàn màn hình.
  • Giảm FPS khi lấy mẫu video.
  • Giới hạn max_tokens cho output.
  • Dùng cached input nếu workload có prompt lặp lại.
  • Log số token thực tế từ response để theo dõi chi phí.

Ví dụ đặt giới hạn output:

resp = client.chat.completions.create(
    model="qwen3.7-plus",
    messages=[
        {
            "role": "user",
            "content": "Trả lời ngắn gọn trong tối đa 5 gạch đầu dòng."
        }
    ],
    max_tokens=300,
)
Enter fullscreen mode Exit fullscreen mode

Xem thêm cách giảm chi phí token tác tửcuộc chiến giá LLM Trung Quốc năm 2026.

Giới hạn tốc độ và lỗi thường gặp

Model Studio áp dụng giới hạn theo tài khoản, gồm:

  • Request mỗi phút
  • Token mỗi phút
  • Giới hạn theo khu vực
  • Giới hạn theo cấp tài khoản

Không có một con số cố định áp dụng cho mọi tài khoản. Hãy kiểm tra trang quota trong console và yêu cầu tăng hạn mức nếu cần.

Xử lý lỗi

401 Unauthorized

Nguyên nhân thường gặp:

  • API key sai
  • API key bị thu hồi
  • Key thuộc khu vực khác với base URL

Kiểm tra:

echo $DASHSCOPE_API_KEY
Enter fullscreen mode Exit fullscreen mode

và xác nhận endpoint bạn đang gọi đúng khu vực.

429 Too Many Requests

Bạn đã chạm giới hạn tốc độ. Cần retry với exponential backoff.

Ví dụ Python đơn giản:

import time
from openai import OpenAI

def call_with_retry(fn, retries=5):
    for attempt in range(retries):
        try:
            return fn()
        except Exception as e:
            if attempt == retries - 1:
                raise

            sleep_seconds = 2 ** attempt
            time.sleep(sleep_seconds)
Enter fullscreen mode Exit fullscreen mode

Trong production, nên phân biệt rõ lỗi 429 và 5xx, đồng thời thêm jitter để tránh nhiều worker retry cùng lúc.

400 Bad Request

Nguyên nhân thường gặp:

  • Payload đa phương thức sai schema
  • Ảnh quá lớn
  • URI base64 sai định dạng
  • Context vượt giới hạn do token thị giác
  • Model ID không đúng

Trước khi gửi request, nên validate:

  • Kích thước file
  • MIME type
  • Độ phân giải ảnh
  • Số khung hình video
  • Tổng số message trong context

Kiểm thử và mock API bằng Apidog

Request đa phương thức dễ sai vì bạn phải lồng mảng content, encode ảnh base64, kiểm tra field hình ảnh/video và đọc response JSON trong nhiều vòng gọi công cụ.

Apidog giúp bạn kiểm thử Qwen 3.7 Plus theo cách trực quan hơn:

  • Gửi request đến endpoint DashScope
  • Lưu API key theo environment
  • Xem response JSON thô
  • Debug payload hình ảnh và video
  • Mock endpoint để frontend/backend tiếp tục phát triển
  • Kiểm tra luồng tác tử khi có nhiều tool call

Khi Plus được dùng trong tác tử GUI hoặc CLI, trình gỡ lỗi tác tử AI của Apidog giúp quan sát toàn bộ chuỗi gọi để tìm bước bị lỗi.

Bạn có thể tải Apidog để kiểm thử, gỡ lỗi và mô phỏng API Qwen 3.7 Plus trước khi đưa vào production.

Checklist trước khi đưa vào production

Trước khi triển khai Qwen 3.7 Plus trong ứng dụng thật, hãy kiểm tra:

  • [ ] API key được lưu trong secret manager hoặc biến môi trường.
  • [ ] Base URL khớp với khu vực tạo key.
  • [ ] Model ID được xác nhận trong tài liệu Model Studio.
  • [ ] Payload ảnh/video đã được validate.
  • [ ] Có retry cho lỗi 429 và 5xx.
  • [ ] Có logging token usage.
  • [ ] Có giới hạn kích thước ảnh và video.
  • [ ] Có giới hạn max_tokens.
  • [ ] Có test request bằng Apidog hoặc công cụ tương đương.
  • [ ] Có cơ chế giám sát chi phí.

Câu hỏi thường gặp

Có gói miễn phí cho API Qwen 3.7 Plus không?

Không có gói miễn phí vĩnh viễn. Tài khoản Alibaba Cloud Model Studio mới có thể nhận hạn ngạch token miễn phí một lần để đánh giá. Sau đó, billing chuyển sang trả theo mức sử dụng.

Model ID là gì?

Model ID thường là:

qwen3.7-plus
Enter fullscreen mode Exit fullscreen mode

Tuy nhiên, định danh có thể thay đổi. Hãy kiểm tra danh sách mô hình Model Studio trước khi triển khai.

Chi phí hình ảnh và video được tính như thế nào?

Hình ảnh và video được chuyển thành token input. Một ảnh chụp màn hình 1080p có thể tiêu tốn vài nghìn token. Video sẽ cộng thêm token theo số khung hình được lấy mẫu, nên payload video lớn có thể chiếm phần lớn hóa đơn.

Qwen 3.7 Plus khác Qwen 3.7 Max như thế nào?

Cả hai đều dùng endpoint tương thích OpenAI. Plus hỗ trợ hình ảnh và video trong message, đồng thời có chi phí thấp hơn khoảng sáu lần ở input. Max là bản chỉ văn bản và vẫn có lợi thế nhỏ ở một số benchmark văn bản thuần túy.

Có thể tự host Qwen 3.7 Plus không?

Không. Trọng số của Qwen 3.7 Plus không được mở. Bạn chỉ có thể dùng qua Alibaba Cloud Model Studio.

Nên dùng base URL nào?

Dùng base URL khớp với khu vực tạo API key:

  • Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
  • Hoa Kỳ, Virginia: https://dashscope-us.aliyuncs.com/compatible-mode/v1
  • Bắc Kinh: https://dashscope.aliyuncs.com/compatible-mode/v1

Key từ khu vực này sẽ không xác thực được với endpoint của khu vực khác.

Kết luận

Tích hợp Qwen 3.7 Plus khá đơn giản nếu bạn đã quen OpenAI SDK: đổi base_url, dùng API key của DashScope và gọi /chat/completions với qwen3.7-plus. Phần cần kiểm soát kỹ là payload đa phương thức, vì ảnh và video ảnh hưởng trực tiếp đến token, context và chi phí.

Cách triển khai an toàn là: lấy key, gửi request văn bản trước, thêm ảnh/video sau, giới hạn kích thước media, log token usage và kiểm thử toàn bộ luồng trong Apidog trước khi đưa vào production.

Top comments (0)