Qwen 3.7 Plus là mô hình tác tử đa phương thức của Alibaba: nhận văn bản, hình ảnh và video, hỗ trợ ngữ cảnh 1M token và có mức giá thấp hơn đáng kể so với dòng Max. Vì mô hình chỉ được cung cấp qua API, bài viết này tập trung vào các bước triển khai thực tế: lấy khóa API, gửi request đầu tiên, truyền hình ảnh/video, ước tính chi phí và kiểm thử bằng Apidog.
Bạn sẽ dùng Alibaba Cloud Model Studio để gọi endpoint tương thích OpenAI, sau đó có thể dùng Apidog để kiểm thử request, xem JSON thô, quản lý biến môi trường và mock endpoint trong khi ứng dụng đang được xây dựng. Nếu cần xem trước năng lực của mô hình, hãy đọc tổng quan về Qwen 3.7 Plus; nếu bạn cần bản chỉ văn bản, xem hướng dẫn API Qwen 3.7 cơ bản.
Tóm tắt triển khai
Qwen 3.7 Plus chạy qua Alibaba Cloud Model Studio, còn gọi là DashScope, trên endpoint tương thích OpenAI. Cấu hình cơ bản gồm:
- Base URL theo khu vực
- API key dạng Bearer token
- Endpoint
/chat/completions - Model ID:
qwen3.7-plus - Payload đa phương thức bằng mảng
contenttrong message
Giá tham chiếu:
| Loại token | Giá |
|---|---|
| Input | 0,40 đô la / 1M token |
| Output | 1,60 đô la / 1M token |
| Cached input | 0,08 đô la / 1M token |
Không có gói miễn phí vĩnh viễn. Tài khoản Model Studio mới có thể nhận hạn ngạch miễn phí một lần để đánh giá. Hình ảnh và video được quy đổi thành token, dùng chung ngân sách ngữ cảnh 1M token, nên payload thị giác sẽ ảnh hưởng trực tiếp đến chi phí.
Trước khi triển khai production, hãy xác nhận model ID hiện tại trong tài liệu Model Studio vì định danh có thể thay đổi.
Cách truy cập Qwen 3.7 Plus
Qwen 3.7 Plus có hai bề mặt sử dụng chính.
1. Qwen Chat
Truy cập chat.qwen.ai, đăng nhập, chọn mô hình Plus và thử với ảnh chụp màn hình hoặc prompt văn bản.
Dùng cách này khi bạn muốn:
- Kiểm tra nhanh chất lượng phản hồi
- Thử khả năng hiểu ảnh
- Đánh giá mô hình trước khi viết code
Không dùng cách này cho tích hợp API.
2. Alibaba Cloud Model Studio / DashScope
Đây là API chính thức để tích hợp vào ứng dụng. Model Studio cung cấp endpoint tương thích OpenAI, nên bạn có thể dùng OpenAI SDK và chỉ cần thay:
base_urlapi_keymodel
Giới hạn quan trọng
Qwen 3.7 Plus là mô hình đóng. Không có trọng số mở để tải xuống, tự host hoặc chạy offline. Nếu self-host là yêu cầu bắt buộc, Plus không phù hợp. Xem thêm tổng quan về Qwen 3.7 Plus.
| Phương pháp | Truy cập API | Chi phí | Phù hợp cho |
|---|---|---|---|
| Qwen Chat (chat.qwen.ai) | Không | Miễn phí, có giới hạn tốc độ | Đánh giá nhanh với hình ảnh |
| Model Studio / DashScope | Có, tương thích OpenAI | Trả theo token | Tích hợp production |
| Tự host | Không | Không áp dụng | Không khả dụng vì trọng số đóng |
Lấy API key Qwen 3.7 Plus
Thực hiện các bước sau trong Alibaba Cloud:
- Tạo tài khoản Alibaba Cloud.
- Mở bảng điều khiển Model Studio tại
modelstudio.console.alibabacloud.com. - Kích hoạt Model Studio cho tài khoản và khu vực của bạn.
- Vào phần API key và tạo khóa mới.
- Sao chép khóa một lần và lưu như mật khẩu.
Khóa thường có dạng:
sk-...
Lưu ý: API key bị ràng buộc theo khu vực. Ví dụ, key tạo ở Singapore sẽ không xác thực được với endpoint Bắc Kinh.
Chọn base URL theo khu vực
| Khu vực | Base URL |
|---|---|
| Singapore | https://dashscope-intl.aliyuncs.com/compatible-mode/v1 |
| Hoa Kỳ, Virginia | https://dashscope-us.aliyuncs.com/compatible-mode/v1 |
| Bắc Kinh, Trung Quốc | https://dashscope.aliyuncs.com/compatible-mode/v1 |
Đặt key trong biến môi trường thay vì hard-code vào source code.
# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"
# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"
Gửi request đầu tiên
Endpoint tương thích OpenAI, nên bạn có thể gọi bằng OpenAI SDK hoặc HTTP thô.
Endpoint:
POST /chat/completions
Model:
qwen3.7-plus
Hãy kiểm tra lại model ID trong danh sách mô hình Model Studio trước khi deploy.
Python với OpenAI SDK
Cài SDK:
pip install openai
Code mẫu:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DASHSCOPE_API_KEY"],
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": "Tóm tắt mô hình định giá Qwen 3.7 Plus trong hai câu."
}
],
)
print(resp.choices[0].message.content)
Nếu bạn dùng khu vực khác, đổi base_url theo bảng ở trên.
curl
curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [
{
"role": "user",
"content": "Xin chào từ API Qwen 3.7 Plus."
}
]
}'
JavaScript
Cài SDK:
npm install openai
Code mẫu:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});
const resp = await client.chat.completions.create({
model: "qwen3.7-plus",
messages: [
{
role: "user",
content: "Xin chào từ API Qwen 3.7 Plus.",
},
],
});
console.log(resp.choices[0].message.content);
Gửi hình ảnh
Điểm khác biệt chính của Qwen 3.7 Plus so với Max là hỗ trợ đầu vào đa phương thức. Với hình ảnh, bạn truyền content dưới dạng mảng gồm nhiều phần: text và image.
Ví dụ Python:
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Nút nào gửi biểu mẫu này? Trả về tọa độ pixel."
},
{
"type": "image_url",
"image_url": {
"url": "https://example.com/screenshot.png"
}
},
],
}
],
)
print(resp.choices[0].message.content)
Bạn có thể dùng:
- URL ảnh công khai
- URI dữ liệu base64
Ví dụ với base64:
import base64
import mimetypes
image_path = "screenshot.png"
mime_type = mimetypes.guess_type(image_path)[0] or "image/png"
with open(image_path, "rb") as f:
image_base64 = base64.b64encode(f.read()).decode("utf-8")
data_url = f"data:{mime_type};base64,{image_base64}"
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Phân tích ảnh chụp màn hình này và chỉ ra nút đăng nhập."
},
{
"type": "image_url",
"image_url": {
"url": data_url
}
},
],
}
],
)
Cách này hữu ích khi ảnh nằm trong máy local hoặc pipeline CI/CD.
Gửi video
Video cũng dùng cùng ý tưởng: thêm phần video vào content. Tuy nhiên tên field chính xác có thể khác theo khu vực hoặc phiên bản schema, nên hãy kiểm tra tài liệu tương thích OpenAI của DashScope trước khi triển khai.
Về mặt thiết kế hệ thống, nên xử lý video theo các bước:
- Giới hạn độ dài video.
- Lấy mẫu khung hình thay vì gửi toàn bộ.
- Giảm độ phân giải khi không cần chi tiết pixel cao.
- Gửi prompt rõ ràng về tác vụ cần phân tích.
Ví dụ prompt:
Phân tích các khung hình video và liệt kê các bước người dùng đã thực hiện trong giao diện.
Trả về JSON gồm: action, target, timestamp.
Với tác tử GUI, bạn có thể yêu cầu mô hình trả về hành động có cấu trúc, ví dụ:
click at (x=487, y=232)
hoặc:
{
"action": "click",
"x": 487,
"y": 232,
"target": "Submit button"
}
Giá Qwen 3.7 Plus
Qwen 3.7 Plus được định giá như một mô hình đa phương thức tiết kiệm.
| Mô hình | Input / 1M token | Output / 1M token | Cached input / 1M token |
|---|---|---|---|
| Qwen 3.7 Plus | 0,40 đô la | 1,60 đô la | 0,08 đô la |
| Qwen 3.7 Max | 2,50 đô la | 7,50 đô la | 0,25 đô la |
Plus rẻ hơn khoảng sáu lần so với Max ở chiều input. Không có gói miễn phí vĩnh viễn, nhưng tài khoản Model Studio mới có thể nhận hạn ngạch token miễn phí một lần, thường ở khu vực Singapore.
Đường dẫn miễn phí Qwen OAuth cũ đã ngừng hoạt động vào ngày 15 tháng 4 năm 2026, nên không nên xây dựng luồng tích hợp dựa trên cơ chế đó.
Tham khảo thêm:
Ước tính chi phí request
Văn bản thường rất rẻ. Chi phí tăng đáng kể khi bạn gửi ảnh lớn hoặc video vì nội dung thị giác được quy đổi thành token input.
| Yêu cầu | Token input | Token output | Chi phí ước tính |
|---|---|---|---|
| Prompt chỉ văn bản | 10.000 | 2.000 | ~0,007 đô la |
| Một ảnh chụp màn hình 1080p + prompt | ~1.500 | 300 | ~0,001 đô la |
| Video 30 giây, lấy mẫu 2 khung hình/giây | ~77.000 | 500 | ~0,032 đô la |
Các con số này chỉ là ước tính. Token thực tế phụ thuộc vào độ phân giải, số khung hình, cách nén và schema xử lý của API.
Để kiểm soát chi phí:
- Resize ảnh trước khi gửi.
- Crop vùng giao diện liên quan thay vì gửi toàn màn hình.
- Giảm FPS khi lấy mẫu video.
- Giới hạn
max_tokenscho output. - Dùng cached input nếu workload có prompt lặp lại.
- Log số token thực tế từ response để theo dõi chi phí.
Ví dụ đặt giới hạn output:
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[
{
"role": "user",
"content": "Trả lời ngắn gọn trong tối đa 5 gạch đầu dòng."
}
],
max_tokens=300,
)
Xem thêm cách giảm chi phí token tác tử và cuộc chiến giá LLM Trung Quốc năm 2026.
Giới hạn tốc độ và lỗi thường gặp
Model Studio áp dụng giới hạn theo tài khoản, gồm:
- Request mỗi phút
- Token mỗi phút
- Giới hạn theo khu vực
- Giới hạn theo cấp tài khoản
Không có một con số cố định áp dụng cho mọi tài khoản. Hãy kiểm tra trang quota trong console và yêu cầu tăng hạn mức nếu cần.
Xử lý lỗi
401 Unauthorized
Nguyên nhân thường gặp:
- API key sai
- API key bị thu hồi
- Key thuộc khu vực khác với base URL
Kiểm tra:
echo $DASHSCOPE_API_KEY
và xác nhận endpoint bạn đang gọi đúng khu vực.
429 Too Many Requests
Bạn đã chạm giới hạn tốc độ. Cần retry với exponential backoff.
Ví dụ Python đơn giản:
import time
from openai import OpenAI
def call_with_retry(fn, retries=5):
for attempt in range(retries):
try:
return fn()
except Exception as e:
if attempt == retries - 1:
raise
sleep_seconds = 2 ** attempt
time.sleep(sleep_seconds)
Trong production, nên phân biệt rõ lỗi 429 và 5xx, đồng thời thêm jitter để tránh nhiều worker retry cùng lúc.
400 Bad Request
Nguyên nhân thường gặp:
- Payload đa phương thức sai schema
- Ảnh quá lớn
- URI base64 sai định dạng
- Context vượt giới hạn do token thị giác
- Model ID không đúng
Trước khi gửi request, nên validate:
- Kích thước file
- MIME type
- Độ phân giải ảnh
- Số khung hình video
- Tổng số message trong context
Kiểm thử và mock API bằng Apidog
Request đa phương thức dễ sai vì bạn phải lồng mảng content, encode ảnh base64, kiểm tra field hình ảnh/video và đọc response JSON trong nhiều vòng gọi công cụ.
Apidog giúp bạn kiểm thử Qwen 3.7 Plus theo cách trực quan hơn:
- Gửi request đến endpoint DashScope
- Lưu API key theo environment
- Xem response JSON thô
- Debug payload hình ảnh và video
- Mock endpoint để frontend/backend tiếp tục phát triển
- Kiểm tra luồng tác tử khi có nhiều tool call
Khi Plus được dùng trong tác tử GUI hoặc CLI, trình gỡ lỗi tác tử AI của Apidog giúp quan sát toàn bộ chuỗi gọi để tìm bước bị lỗi.
Bạn có thể tải Apidog để kiểm thử, gỡ lỗi và mô phỏng API Qwen 3.7 Plus trước khi đưa vào production.
Checklist trước khi đưa vào production
Trước khi triển khai Qwen 3.7 Plus trong ứng dụng thật, hãy kiểm tra:
- [ ] API key được lưu trong secret manager hoặc biến môi trường.
- [ ] Base URL khớp với khu vực tạo key.
- [ ] Model ID được xác nhận trong tài liệu Model Studio.
- [ ] Payload ảnh/video đã được validate.
- [ ] Có retry cho lỗi 429 và 5xx.
- [ ] Có logging token usage.
- [ ] Có giới hạn kích thước ảnh và video.
- [ ] Có giới hạn
max_tokens. - [ ] Có test request bằng Apidog hoặc công cụ tương đương.
- [ ] Có cơ chế giám sát chi phí.
Câu hỏi thường gặp
Có gói miễn phí cho API Qwen 3.7 Plus không?
Không có gói miễn phí vĩnh viễn. Tài khoản Alibaba Cloud Model Studio mới có thể nhận hạn ngạch token miễn phí một lần để đánh giá. Sau đó, billing chuyển sang trả theo mức sử dụng.
Model ID là gì?
Model ID thường là:
qwen3.7-plus
Tuy nhiên, định danh có thể thay đổi. Hãy kiểm tra danh sách mô hình Model Studio trước khi triển khai.
Chi phí hình ảnh và video được tính như thế nào?
Hình ảnh và video được chuyển thành token input. Một ảnh chụp màn hình 1080p có thể tiêu tốn vài nghìn token. Video sẽ cộng thêm token theo số khung hình được lấy mẫu, nên payload video lớn có thể chiếm phần lớn hóa đơn.
Qwen 3.7 Plus khác Qwen 3.7 Max như thế nào?
Cả hai đều dùng endpoint tương thích OpenAI. Plus hỗ trợ hình ảnh và video trong message, đồng thời có chi phí thấp hơn khoảng sáu lần ở input. Max là bản chỉ văn bản và vẫn có lợi thế nhỏ ở một số benchmark văn bản thuần túy.
Có thể tự host Qwen 3.7 Plus không?
Không. Trọng số của Qwen 3.7 Plus không được mở. Bạn chỉ có thể dùng qua Alibaba Cloud Model Studio.
Nên dùng base URL nào?
Dùng base URL khớp với khu vực tạo API key:
- Singapore:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1 - Hoa Kỳ, Virginia:
https://dashscope-us.aliyuncs.com/compatible-mode/v1 - Bắc Kinh:
https://dashscope.aliyuncs.com/compatible-mode/v1
Key từ khu vực này sẽ không xác thực được với endpoint của khu vực khác.
Kết luận
Tích hợp Qwen 3.7 Plus khá đơn giản nếu bạn đã quen OpenAI SDK: đổi base_url, dùng API key của DashScope và gọi /chat/completions với qwen3.7-plus. Phần cần kiểm soát kỹ là payload đa phương thức, vì ảnh và video ảnh hưởng trực tiếp đến token, context và chi phí.
Cách triển khai an toàn là: lấy key, gửi request văn bản trước, thêm ảnh/video sau, giới hạn kích thước media, log token usage và kiểm thử toàn bộ luồng trong Apidog trước khi đưa vào production.


Top comments (0)