Sebastian Petrus

Posted on Mar 19 • Originally published at apidog.com

Xiaomi ra mắt mô hình AI riêng, miễn phí trên OpenRouter

Xiaomi MiMo-V2-Pro là mô hình AI nghìn tỷ tham số với chi phí thấp hơn 67% Claude Sonnet 4.6, tiệm cận Claude Opus 4.6 ở các tác vụ agent và vượt Sonnet 4.6 trong lập trình. Sau một tuần thử nghiệm bí mật trên OpenRouter (dưới tên "Hunter Alpha", xử lý hơn 1T token), Xiaomi chính thức phát hành MiMo-V2-Pro với cửa sổ ngữ cảnh lên tới 1 triệu token và tặng một tuần truy cập API miễn phí.

Dùng thử Apidog ngay hôm nay

Bạn từng biết Xiaomi qua điện thoại thông minh hoặc xe điện? Giờ, họ lấn sân trực tiếp vào lĩnh vực AI nền tảng – nơi vốn dành cho Anthropic, OpenAI, Google.

Xiaomi MiMo-V2-Pro là gì?

Tính năng	MiMo-V2-Pro	Claude Sonnet 4.6	Claude Opus 4.6
Giá (đầu vào/đầu ra)	$1/$3 cho 1 triệu token	$3/$15 cho 1 triệu token	$5/$25 cho 1 triệu token
Cửa sổ ngữ cảnh	1 triệu token	200K token	200K token
SWE-bench đã xác minh	78.0%	79.6%	80.8%
ClawEval (tác vụ tác nhân)	61.5%	66.3%	66.3%
PinchBench	84.0%	86.9%	86.3%
Kiến trúc	Tổng 1T, 42B hoạt động	Ước tính ~200B	Ước tính ~400B
Truy cập miễn phí	✅ Một tuần trên OpenRouter	❌ Chỉ trả phí	❌ Chỉ trả phí

Tóm tắt ngắn gọn: MiMo-V2-Pro là mô hình nền tảng của Xiaomi, tối ưu cho các agent workflow phức tạp (không chỉ Q&A). Bạn có thể dùng miễn phí trên OpenRouter trong một tuần.

Bước ngoặt AI của Xiaomi

Xiaomi vốn nổi tiếng với điện thoại và xe điện, giờ đang chuyển hướng mạnh vào AI nền tảng, cạnh tranh trực tiếp với các “ông lớn” toàn cầu.

Hunter Alpha: Thử nghiệm thực chiến

Trước khi công bố, Xiaomi thử nghiệm MiMo-V2-Pro dưới tên "Hunter Alpha" trên OpenRouter, đạt:

Đứng đầu bảng xếp hạng usage OpenRouter nhiều ngày
Xử lý hơn 1T token trong tuần đầu
Top 8 toàn cầu trên AI Analytics Index
Top 2 LLM Trung Quốc (sau DeepSeek)

MiMo-V2-Pro là bản production, cải tiến dựa trên phản hồi thực tế. Xiaomi tận dụng giai đoạn này để nâng cao khả năng xử lý context dài và ổn định agent workflow.

Hiệu suất MiMo-V2-Pro qua số liệu

Xiaomi công khai các benchmark trực tiếp với các tên tuổi lớn.

Benchmark tác vụ agent: Gần sát Opus 4.6

Điểm chuẩn	MiMo-V2-Pro	Claude Opus 4.6	Claude Sonnet 4.6	GPT-5.2
ClawEval	61.5%	66.3%	66.3%	50.0%
PinchBench	84.0%	86.3%	86.9%	77.0%
GDPVal-AA	96.8	99.3	97.9	98.7
τ2-bench (Viễn thông)	93.5	98.0	97.9	98.0

MiMo-V2-Pro đứng ngay sau Sonnet và Opus ở agent benchmark – đủ cạnh tranh cho use-case thực tế.

Lập trình: Vượt Sonnet 4.6

Điểm chuẩn	MiMo-V2-Pro	Claude Opus 4.6	Claude Sonnet 4.6	GPT-5.2
SWE-bench đã xác minh	78.0%	80.8%	79.6%	80.0%
SWE-bench Đa ngôn ngữ	71.7%	77.8%	75.9%	72.0%
Terminal-Bench 2.0	57.1%	65.4%	59.1%	54.0%
DeepSearch QA-F1	86.7%	91.3%	89.2%	79.0%

Trên SWE-bench Verified, MiMo-V2-Pro vượt Sonnet 4.6 – một trong các benchmark lập trình uy tín nhất.

Kiến trúc nổi bật

1T+ tham số, 42B hoạt động khi inference
Hybrid Attention tỷ lệ 7:1 (V2-Flash là 5:1)
Cửa sổ ngữ cảnh 1M token
Lớp MTP (multi-token prediction) tăng tốc độ sinh
Gấp 3 lần MiMo-V2-Flash

Hybrid attention giúp xử lý context lớn mà giữ được tốc độ.

Giá: Rẻ hơn 67% Sonnet 4.6

Mô hình	Đầu vào (mỗi 1M)	Đầu ra (mỗi 1M)	Đọc Cache	Ghi Cache
MiMo-V2-Pro (≤256K)	$1	$3	$0.20	Miễn phí
MiMo-V2-Pro (256K-1M)	$2	$6	$0.40	Miễn phí
Claude Sonnet 4.6	$3	$15	$0.30	$3.75
Claude Opus 4.6	$5	$25	$0.50	$6.25

Dùng context tối đa 1M token vẫn rẻ hơn Sonnet ở 200K. Ghi cache miễn phí trong tuần ra mắt.

Truy cập miễn phí một tuần

Xiaomi hợp tác với năm agent framework cho 1 tuần dùng API miễn phí:

OpenClaw
OpenCode
KiloCode
Blackbox
Cline

Nếu bạn dùng một trong các framework này, có thể tích hợp và test MiMo-V2-Pro ngay.

Mô hình cho agent: Không chỉ chatbot

MiMo-V2-Pro tối ưu orchestration workflow, không chỉ trả lời chat thông thường.

Kết nối OpenClaw

OpenClaw – agent framework mã nguồn mở nổi bật, MiMo-V2-Pro được fine-tune chuyên sâu:

SFT + RL trên workflow phức tạp
Gọi công cụ (tool-calling) ổn định trên multi-step workflow
Ngữ cảnh 1M token cho Claw apps lớn
Tích hợp gốc với orchestrator lớp của OpenClaw

Benchmark OpenClaw:

PinchBench: 84.0% (chỉ sau Sonnet & Opus)
ClawEval: 61.5% (ngang Opus, vượt Sonnet)

Agent thực chiến

Các use-case thực tế:

Sinh mã đa tệp cho toàn repo
Debug API lặp lại nhiều lần
Thiết kế schema DB + migration tự động
Tạo UI component đầy đủ style

Các dev sử dụng MiMo-V2-Pro để build workflow production, không chỉ thử nghiệm.

Demo sinh giao diện người dùng

Xiaomi công bố ví dụ MiMo-V2-Pro sinh app UI hoàn chỉnh qua OpenClaw.

Ví dụ: Trang web tạp chí 1990s

Prompt:

Bắt chước thẩm mỹ tạp chí in những năm 1990...

Mô hình sinh ra web page đúng thông số kỹ thuật, chỉ trong một lần gọi.

Hướng dẫn truy cập API MiMo-V2-Pro

Bạn có 2 lựa chọn: dùng OpenRouter (miễn phí tuần đầu) hoặc API trực tiếp Xiaomi.

Cách 1: OpenRouter (miễn phí)

Bước 1: Đăng ký tài khoản OpenRouter

Truy cập openrouter.ai
Đăng ký bằng GitHub/email
Vào mục API Keys
Tạo khóa mới

Bước 2: Gửi request API đầu tiên

import requests
import json

url = "https://openrouter.ai/api/v1/chat/completions"
headers = {
    "Authorization": "Bearer YOUR_OPENROUTER_KEY",
    "Content-Type": "application/json"
}

payload = {
    "model": "xiaomi/mimo-v2-pro",
    "messages": [
        {"role": "user", "content": "Build a REST API with user authentication in Python"}
    ]
}

response = requests.post(url, headers=headers, json=payload)
print(json.dumps(response.json(), indent=2))

Bước 3: Test với Apidog

Debug API agent phức tạp cần client chuyên dụng. Apidog hỗ trợ:

Hiển thị JSON response chi tiết, syntax highlight
Theo dõi hội thoại nhiều lượt
Test tham số (temperature, max_tokens, ...)
Chia sẻ session debug với team

Nhập spec OpenRouter vào Apidog để kiểm thử nhanh chóng.

Cách 2: API Xiaomi trực tiếp

Dùng cho production hoặc tích hợp lâu dài.

Bước 1: Lấy API credentials

Truy cập platform.xiaomimimo.com
Tạo tài khoản
Vào quản lý API
Tạo credentials

Bước 2: Cấu hình client

import requests

API_KEY = "your-xiaomi-api-key"
ENDPOINT = "https://api.xiaomimimo.com/v1/chat/completions"

headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

payload = {
    "model": "mimo-v2-pro",
    "messages": [
        {"role": "system", "content": "You are a helpful coding assistant."},
        {"role": "user", "content": "Create a FastAPI endpoint with JWT authentication"}
    ],
    "temperature": 0.7,
    "max_tokens": 8192
}

response = requests.post(ENDPOINT, headers=headers, json=payload)
print(response.json())

Cách 3: Tích hợp với agent framework

Nếu dùng OpenClaw, OpenCode, KiloCode, Blackbox, Cline – xem tài liệu framework để tích hợp MiMo-V2-Pro (truy cập miễn phí tuần đầu).

Ví dụ OpenClaw:

from openclaw import Agent

agent = Agent(
    model="xiaomi/mimo-v2-pro",
    tools=["file_system", "terminal", "browser"],
    context_limit=1_000_000  # Full 1M token context
)

result = agent.run("Analyze this codebase and suggest improvements")

So sánh MiMo-V2-Pro với đối thủ

So với Claude Sonnet 4.6

Khía cạnh	MiMo-V2-Pro	Claude Sonnet 4.6
Giá	$1/$3 cho 1M	$3/$15 cho 1M
Ngữ cảnh	1M token	200K token
SWE-bench đã xác minh	78.0%	79.6%
ClawEval	61.5%	66.3%
PinchBench	84.0%	86.9%
Gói miễn phí	✅ Một tuần	❌ Không

Nên chọn MiMo-V2-Pro nếu: Cần context siêu dài, giá rẻ, muốn thử miễn phí.

Chọn Sonnet nếu: Đã dùng hệ Anthropic, cần agent performance tối đa.

So với Claude Opus 4.6

Khía cạnh	MiMo-V2-Pro	Claude Opus 4.6
Giá	$1/$3 cho 1M	$5/$25 cho 1M
Ngữ cảnh	1M token	200K token
SWE-bench đã xác minh	78.0%	80.8%
ClawEval	61.5%	66.3%
PinchBench	84.0%	86.3%

Nên chọn MiMo-V2-Pro nếu: Muốn 80% hiệu năng Opus với 20% chi phí.

Chọn Opus nếu: Cần hiệu suất tuyệt đối, giá không phải vấn đề.

So với GPT-5.2

Khía cạnh	MiMo-V2-Pro	GPT-5.2
Giá	$1/$3 cho 1M	Thay đổi
Ngữ cảnh	1M token	128K token
SWE-bench đã xác minh	78.0%	80.0%
ClawEval	61.5%	50.0%
PinchBench	84.0%	77.0%

Nên chọn MiMo-V2-Pro nếu: Cần agent performance cao, context dài.

Chọn GPT-5.2 nếu: Đã đầu tư sâu hệ OpenAI.

Các use-case thực tế

1. Phát triển & kiểm thử API

MiMo-V2-Pro có thể sinh mã API hoàn chỉnh kèm xác thực, validation, xử lý lỗi.

# Agent workflow tạo API
api_agent = Agent(
    model="xiaomi/mimo-v2-pro",
    tools=["file_system", "package_manager", "test_runner"]
)

result = api_agent.run("""
Tạo một ứng dụng FastAPI với:
- Xác thực JWT
- Các endpoint đăng ký và đăng nhập người dùng
- Các tuyến tài nguyên được bảo vệ
- Bộ kiểm thử Pytest
- Cấu hình Docker
""")

2. Di chuyển mã nguồn cũ

Cửa sổ 1M token cho phép nạp toàn bộ repo để phân tích và migrate.

migration_agent = Agent(
    model="xiaomi/mimo-v2-pro",
    context_window=1_000_000
)

legacy_code = load_repository("./legacy-python-2")

result = migration_agent.run("""
Phân tích cơ sở mã Python 2 này và:
1. Xác định tất cả cú pháp dành riêng cho Python 2
2. Tạo các phiên bản tương thích Python 3.11
3. Tạo báo cáo di chuyển
4. Đề xuất các cải tiến hiện đại hóa
""")

3. Dàn khung dự án đa tệp

Sinh scaffold dự án full-stack chỉ với một prompt.

scaffold_agent = Agent(
    model="xiaomi/mimo-v2-pro",
    tools=["file_system"]
)

result = scaffold_agent.run("""
Tạo một ứng dụng Next.js full-stack với:
- Cấu trúc App Router
- Cấu hình TypeScript
- Thiết lập Tailwind CSS
- Xác thực với NextAuth
- Tích hợp cơ sở dữ liệu với Prisma
- Các tuyến API cho các thao tác CRUD
- Bộ kiểm thử hoàn chỉnh với Jest
""")

Hạn chế và lưu ý

Hạn chế đã biết

Hệ sinh thái: Dev cộng đồng nhỏ hơn OpenAI/Anthropic
Tài liệu: Một số tính năng thiếu hướng dẫn chi tiết
Tích hợp tool: Còn ít tích hợp sẵn so với đối thủ lớn
SLA Doanh nghiệp: Chưa hỗ trợ triển khai production quy mô lớn

Khi nào KHÔNG nên chọn MiMo-V2-Pro

Cần SLA & support doanh nghiệp
Phụ thuộc sâu vào tích hợp Anthropic/OpenAI
Yêu cầu uptime cam kết chính thức
Xây dựng sản phẩm consumer cần kiểm soát an toàn nghiêm ngặt

Tổng kết

Sự xuất hiện của Xiaomi ở mảng AI nền tảng khiến cuộc chơi LLM thêm cạnh tranh.

Nên thử MiMo-V2-Pro nếu:

Muốn hiệu năng gần Claude với chi phí cực thấp
Cần context 1M token cho codebase/tài liệu lớn
Build agent workflow với OpenClaw hoặc các framework tương tự
Tận dụng tuần miễn phí trên OpenRouter

Nên cân nhắc nếu:

Cần SLA doanh nghiệp & hỗ trợ chuyên sâu
Team bạn đã đầu tư mạnh hệ Anthropic/OpenAI
Sản phẩm consumer yêu cầu safety tuning mở rộng

Tuần miễn phí trên OpenRouter là cơ hội test thực chiến với workflow của bạn.

FAQ

MiMo-V2-Pro có miễn phí trên OpenRouter không?

Có, một tuần đầu. Sau đó áp giá chuẩn ($1/$3 cho 1M token).

So với Claude Sonnet 4.6 ra sao?

SWE-bench Verified: MiMo-V2-Pro 78.0% so với Sonnet 79.6%. Agent task (ClawEval): 61.5% vs 66.3%. MiMo-V2-Pro rẻ hơn 67%, context gấp 5 lần (1M vs 200K).

Dùng cho dự án thương mại được không?

Được. API Xiaomi cho phép sử dụng thương mại – kiểm tra chi tiết license trong docs.

Context tối đa bao nhiêu?

1M token. Giá phân cấp: $1/$3 cho 1M ở context ≤ 256K, $2/$6 cho 1M ở context 256K–1M.

Hỗ trợ function calling không?

Có, tối ưu tool use-case và agent workflow. Các chỉ số PinchBench/ClawEval đều cao.

Hết tuần miễn phí thì sao?

Bạn có thể dùng:

OpenRouter (trả phí)
API Xiaomi trực tiếp qua platform.xiaomimimo.com
Các agent framework (OpenClaw, OpenCode, KiloCode, Blackbox, Cline)

Có tự deploy được không?

Không. Hiện chỉ cung cấp qua API, chưa có plan self-host.

Các bước tiếp theo

Kiểm thử API: Đăng ký OpenRouter hoặc Xiaomi Platform
Thử với Apidog: Nhập spec API, gỡ lỗi dễ dàng
Khám phá OpenClaw: Xem tích hợp agent gốc
Tham gia cộng đồng: Theo dõi update, thảo luận về MiMo

Bạn muốn kiểm thử API AI hiệu quả hơn? Tải Apidog, công cụ client API tất cả trong một cho kiểm thử, debug, document endpoint AI.