خفضت المختبرات الصينية أسعار واجهات برمجة تطبيقات LLM ست مرات في النصف الأول من عام 2026، وأُعلن عن ثلاث تخفيضات منها كدائمة. أصبح DeepSeek V4-Pro بسعر 0.87 دولار لكل مليون رمز إخراج، ووحّدت Xiaomi MiMo V2.5 تسعير السياق الطويل إلى 3 دولارات للإخراج، ويأتي Qwen3 Max من Alibaba بسعر 3.90 دولارات، بينما يحافظ Kimi K2.6 من Moonshot على حد منخفض جدًا لإصابة الذاكرة المؤقتة عند 0.07 دولار، ويبلغ GLM-5 من Zhipu سعر 3.20 دولارات للإخراج. هذا الدليل يركّز على كيفية اختيار النموذج المناسب حسب عبء العمل، وليس فقط مقارنة الأسعار.
باختصار
- الأرخص لكل رمز إخراج: DeepSeek V4-Pro بسعر 0.87 دولار/مليون رمز إخراج. حوالي 34 ضعفًا أقل من GPT-5.5.
- الأرخص لسياق 1 مليون: Xiaomi MiMo V2.5 Pro بسعر 3 دولارات/مليون رمز إخراج، بسعر ثابت بغض النظر عن طول الإدخال.
- أفضل توازن بين السعر والجودة للإنتاج العام: Alibaba Qwen3 Max بسعر 3.90 دولارات/مليون رمز إخراج، وسياق 262 ألف.
- أقل تكلفة لإصابة الذاكرة المؤقتة للمطالبات النظامية الطويلة: Moonshot Kimi K2.6 بسعر 0.07 دولار/مليون رمز مخزن مؤقتًا.
- أعباء العمل الثقيلة في الاستدلال: Zhipu GLM-5 بسعر 3.20 دولارات/مليون رمز إخراج، وسياق 200 ألف.
- التخفيضات الدائمة: DeepSeek وMiMo وKimi جعلت تخفيضاتها لعام 2026 دائمة.
كيف تطورت حرب أسعار LLM الصينية في عام 2026
بدأ النمط في الربع الرابع من 2025 وتسارع في الربع الثاني من 2026:
- الربع الرابع من 2025: أطلقت DeepSeek V3.2 بسعر 0.28 دولار/مليون رمز إدخال، متجاوزة أسعار النماذج الأمريكية الرائدة بفارق كبير. تبع ذلك Kimi K2.6 بتسعير متدرج حسب السياق ومعدل إصابة ذاكرة مؤقتة منخفض جدًا عند 0.07 دولار/مليون رمز.
- مارس 2026: كشفت Xiaomi عن MiMo V2-Pro على OpenRouter بأسعار تنافسية ولكنها تعتمد على الفئات.
- أبريل 2026: أطلقت DeepSeek V4 بخصم ترويجي بنسبة 75% كان من المفترض أن ينتهي في 31 مايو.
- 22 مايو 2026: أعلنت DeepSeek أن خصم 75% أصبح دائمًا. ظل V4-Pro عند 0.435 دولار للإدخال و0.87 دولار للإخراج إلى أجل غير مسمى. التفاصيل الكاملة هنا.
- 27 مايو 2026: جعلت Xiaomi أسعار MiMo V2.5 دائمة عند 1 دولار للإدخال و3 دولارات للإخراج، مع إلغاء مضاعف السياق الطويل. المزيد حول تخفيض MiMo.
هذه التخفيضات ليست عشوائية. كل مختبر يستهدف فجوة مختلفة:
- DeepSeek يستهدف أقل تكلفة لكل رمز.
- MiMo يستهدف أعباء العمل ذات السياق الطويل.
- Qwen وGLM يحافظان على سعر متوسط ويتنافسان على القدرة.
- Kimi يركز على وكلاء البرمجة وسير العمل المتكرر بفضل تكلفة إصابة الذاكرة المؤقتة.
نظرة سريعة: أفضل 5 واجهات برمجة تطبيقات LLM صينية في مايو 2026
| النموذج | الإدخال ($/مليون رمز) | الإخراج ($/مليون رمز) | إصابة الذاكرة المؤقتة | السياق | الأفضل في |
|---|---|---|---|---|---|
| DeepSeek V4-Pro | 0.435 دولار | 0.87 دولار | 0.003625 دولار | 128 ألف | الأرخص لكل رمز، البرمجة |
| Xiaomi MiMo V2.5 Pro | 1.00 دولار | 3.00 دولارات | 0.20 دولار | 1 مليون | RAG للمستندات الطويلة، وكلاء المستودعات |
| Alibaba Qwen3 Max | 0.78 دولار | 3.90 دولارات | 0.156 دولار | 262 ألف | توازن الإنتاج |
| Moonshot Kimi K2.6 | 0.16–2.00 دولار، متدرج | ~2.50 دولار | 0.07 دولار | 128 ألف | مطالبات النظام الطويلة، وكلاء البرمجة |
| Zhipu GLM-5 | 1.00 دولار | 3.20 دولارات | محدد من المزود | 200 ألف | الاستدلال المنظم |
انتبه إلى ثلاث نقاط قبل الاختيار:
- DeepSeek وMiMo بسعر ثابت. هذا يجعل تخطيط التكلفة أسهل. التسعير المتدرج قد يفاجئك عند ارتفاع طول السياق.
- إصابة الذاكرة المؤقتة تختلف جذريًا. سعر Kimi عند 0.07 دولار وDeepSeek عند 0.003625 دولار مهم جدًا للوكلاء الذين يعيدون استخدام مطالبة نظامية ثابتة. راجع شرح التخزين المؤقت للمطالبات.
- نوافذ السياق تحدد القرار. إذا كنت تحتاج أكثر من 300 ألف رمز، يصبح MiMo هو الخيار العملي في هذه المجموعة.
طريقة عملية لحساب التكلفة قبل الاختيار
قبل نقل حمل عملك، احسب التكلفة من سجلاتك الفعلية بدل الاعتماد على المتوسطات.
مثال بسيط:
function estimateCost({
inputTokens,
outputTokens,
cachedInputTokens = 0,
inputPricePerMillion,
outputPricePerMillion,
cacheHitPricePerMillion = inputPricePerMillion
}) {
const freshInputTokens = Math.max(inputTokens - cachedInputTokens, 0);
return (
(freshInputTokens / 1_000_000) * inputPricePerMillion +
(cachedInputTokens / 1_000_000) * cacheHitPricePerMillion +
(outputTokens / 1_000_000) * outputPricePerMillion
);
}
const deepSeekCost = estimateCost({
inputTokens: 20_000_000,
cachedInputTokens: 12_000_000,
outputTokens: 8_000_000,
inputPricePerMillion: 0.435,
outputPricePerMillion: 0.87,
cacheHitPricePerMillion: 0.003625
});
console.log(`Estimated monthly cost: $${deepSeekCost.toFixed(2)}`);
استخدم نفس الدالة مع أسعار كل مزود، ثم قارن على أساس حركة المرور الفعلية لديك: عدد رموز الإدخال، عدد رموز الإخراج، ونسبة الذاكرة المؤقتة.
DeepSeek: الأرخص لكل رمز
النماذج:
V4-Pro: 0.435 دولار إدخال / 0.87 دولار إخراج / 0.003625 دولار إصابة ذاكرة مؤقتة، سياق 128 ألف.
V4-Flash: 0.14 دولار / 0.28 دولار.
DeepSeek V4-Pro هو الحد الأدنى للأسعار بين النماذج الصينية الرائدة. بعد التخفيض الدائم في 22 مايو، أصبحت رموز الإخراج بسعر 0.87 دولار/مليون رمز. تكلفة إصابة الذاكرة المؤقتة عند 0.003625 دولار/مليون رمز هي الأدنى مباشرة من مختبر رئيسي. تم التأكيد مقابل صفحة الأسعار الرسمية لـ DeepSeek.
استخدم V4-Pro عندما يكون لديك
- توليد كود كثيف الإخراج.
- سلاسل وكلاء تنتج رموزًا كثيرة.
- أدوات محتوى تعتمد على الإخراج أكثر من الإدخال.
- مطالبة نظامية ثابتة من 5 آلاف إلى 10 آلاف رمز.
- إنتاج حساس للتكلفة ويمكنه تحمل فجوة أداء صغيرة مقابل GPT-5.5.
لا تستخدمه عندما يكون لديك
- مستندات تتجاوز سياق 128 ألف.
- تطبيق دردشة لحظي يحتاج زمن استجابة منخفض جدًا.
- عبء عمل طويل السياق حيث MiMo يمكنه استيعاب الطلب وDeepSeek لا يمكنه ذلك.
مثال توجيه بسيط:
function chooseModel({ inputTokens, outputHeavy }) {
if (inputTokens > 128_000) return "xiaomi-mimo-v2.5-pro";
if (outputHeavy) return "deepseek-v4-pro";
return "deepseek-v4-pro";
}
لتغطية أعمق: تخفيض سعر DeepSeek V4-Pro الدائم، ما هو DeepSeek V4، كيفية استخدام واجهة برمجة تطبيقات DeepSeek V4.
Xiaomi MiMo: الخيار الأرخص بسياق 1 مليون
النماذج:
MiMo V2.5 Pro: 1.00 دولار إدخال / 3.00 دولارات إخراج / 0.20 دولار ذاكرة مؤقتة، سياق 1 مليون.
MiMo V2 Flash: حوالي 0.10 دولار / 0.40 دولار، سياق 256 ألف.
تخفيض Xiaomi الدائم في 27 مايو وحّد تسعير MiMo V2.5 عبر نوافذ السياق. اختفت فئات السياق الطويل القديمة التي كانت تفرض مضاعفات فوق 256 ألف رمز إدخال. التسعير الجديد يطبق نفس معدل 1 دولار / 3 دولارات سواء أرسلت 5 آلاف أو 950 ألف رمز. يصف إشعار تحديث الأسعار الرسمي التخفيض بأنه دائم.
استخدم V2.5 Pro عندما يكون لديك
- RAG لمستندات طويلة.
- تحليل مستودع كود كامل.
- تلخيص عدة مستندات ضخمة.
- مدخلات بين 300 ألف و1 مليون رمز.
- حاجة إلى تكلفة ثابتة يمكن التنبؤ بها.
لا تستخدمه عندما يكون لديك
- دردشة قصيرة المطالبات.
- حمل عمل يمكن لـ DeepSeek التعامل معه بسياق أقل من 128 ألف.
- تطبيق حساس جدًا لزمن الاستجابة.
توجيه عملي:
function routeLongContext(inputTokens) {
if (inputTokens > 300_000) {
return "xiaomi-mimo-v2.5-pro";
}
return "deepseek-v4-pro";
}
نافذة السياق البالغة 1 مليون مع سعر ثابت تجعل MiMo خيارًا واضحًا عندما يكون طول السياق هو القيد الأساسي، لا السعر لكل رمز فقط.
لتغطية أعمق: كم يكلف استخدام Xiaomi MiMo V2.5 في عام 2026، تسعير MiMo V2-Pro وOmni وكيفية استخدام واجهة برمجة التطبيقات، برنامج Xiaomi MiMo Orbit المجاني لـ 100 تيرابايت من الرموز.
Alibaba Qwen: حصان العمل الإنتاجي
النماذج:
Qwen3 Max: 0.78 دولار إدخال / 3.90 دولارات إخراج / 0.156 دولار ذاكرة مؤقتة، سياق 262 ألف.
Qwen 3.7 Max الأحدث بسعر 2.50 دولار/مليون رمز إدخال مع سياق 1 مليون في مرحلة الطرح المبكر. تم التحقق من الأسعار مقابل ورقة Qwen3 Max من pricepertoken.
Qwen3 Max هو نموذج Alibaba الرائد والأكثر انتشارًا من النماذج الصينية في الإنتاج العالمي. سعره أعلى من DeepSeek، لكنه يقدم نظامًا بيئيًا أوسع للأدوات، وتوافقًا مع OpenAI، ودعمًا عبر Alibaba Cloud، وسياق 262 ألفًا يناسب كثيرًا من أعباء عمل المؤسسات.
استخدم Qwen3 Max عندما يكون لديك
- إنتاج متعدد اللغات، خصوصًا غير الإنجليزية.
- متطلبات مؤسسة أو نشر عبر Alibaba Cloud.
- مستندات ضمن نطاق 200 ألف إلى 262 ألف رمز.
- حاجة إلى توازن بين الجودة والتكلفة بدل أقل سعر ممكن.
لا تستخدمه عندما يكون لديك
- عبء عمل كثيف الإخراج وحساس للتكلفة.
- إمكانية استخدام DeepSeek دون خسارة جودة مؤثرة.
- حاجة إلى سياق أكبر من 262 ألف رمز.
لتغطية أعمق: Qwen 3 مقابل OpenAI وDeepSeek: مقارنة تقنية متعمقة لمطوري واجهات برمجة التطبيقات.
Moonshot Kimi: المتخصص في البرمجة
النماذج:
Kimi K2.6 مع تسعير إدخال متدرج حسب السياق من 0.16 دولار إلى 2.00 دولار/مليون رمز عبر نطاقات 8 آلاف و32 ألف و64 ألف و128 ألف. حد إصابة الذاكرة المؤقتة 0.07 دولار/مليون رمز. معدلات الإخراج حوالي 2.50 دولار/مليون رمز في النطاق المتوسط.
Kimi K2.6 مناسب عندما تعيد استخدام نفس بادئة السياق أو مطالبة النظام عبر عدد كبير من الطلبات. لذلك يظهر بقوة في وكلاء البرمجة، وروبوتات الدعم ذات الشخصية الثابتة، ومسارات الاسترجاع التي تحتوي كتل سياق متكررة.
استخدم K2.6 عندما يكون لديك
- وكيل برمجة بأسلوب Claude Code.
- استدعاء أدوات متكرر.
- مطالبة نظامية طويلة وثابتة.
- جلسات دردشة طويلة الأمد مع أمثلة few-shot ثابتة.
- سياق متكرر يمكنه الاستفادة من إصابات الذاكرة المؤقتة.
لا تستخدمه عندما يكون لديك
- طلبات متقطعة مختلفة البادئة.
- ميزانية تحتاج تنبؤًا بسيطًا.
- أطوال إدخال تتنقل كثيرًا بين 32 ألف و64 ألف و128 ألف.
قاعدة تنفيذ مفيدة:
function shouldUseKimi({ hasStableSystemPrompt, usesTools, inputTokens }) {
return hasStableSystemPrompt && usesTools && inputTokens <= 128_000;
}
لتغطية أعمق: هل يستحق تسعير واجهة برمجة تطبيقات Kimi K2 الضجة حقًا للمطورين في عام 2026؟
Zhipu GLM: المنافس في الاستدلال
النماذج:
GLM-5: 1.00 دولار إدخال / 3.20 دولارات إخراج، سياق 200 ألف.
GLM-5.1: 0.98 دولار / 3.08 دولارات، سياق 200 ألف. تم التحقق من الأسعار مقابل نظرة عامة على الأسعار الرسمية لـ Z.AI.
أطلقت Zhipu GLM-5 بزيادة سعر 30% عن GLM-4.7، ثم أصدرت GLM-5.1 بخصم هامشي. موقعه واضح: ليس الأرخص، لكنه قوي في الاستدلال المنظم وسلاسل التفكير.
استخدم GLM-5 عندما يكون لديك
- رياضيات أو استدلال رسمي.
- تحليل مالي أو قانوني حيث الخطأ مكلف.
- تلخيص علمي أو استنتاج منظم.
- وكلاء متعددون الخطوات يحتاجون تتبع استدلال واضح.
لا تستخدمه عندما يكون لديك
- توليد محتوى مباشر.
- تلخيص بسيط.
- عبء عمل تتحكم فيه التكلفة أكثر من جودة الاستدلال.
لتغطية أعمق: GLM-5 مقابل DeepSeek V3 مقابل GPT-5: السرعة، التكلفة، ومقارنة عملية للمطورين، GLM-5.1 مقابل Claude, GPT, Gemini, DeepSeek.
الأرخص لكل عبء عمل: مصفوفة للمشترين
| عبء العمل | الفائز | السبب |
|---|---|---|
| توليد الأكواد، كثيف الإخراج | DeepSeek V4-Pro | سعر 0.87 دولار/مليون رمز إخراج لا يُضاهى |
| RAG للمستندات الطويلة، سياق أكبر من 300 ألف | Xiaomi MiMo V2.5 Pro | الخيار الوحيد بسعر ثابت وسياق 1 مليون |
| وكيل برمجة بمطالبة نظامية ثابتة | Kimi K2.6 | حد منخفض لإصابة الذاكرة المؤقتة عند 0.07 دولار/مليون رمز |
| دعم العملاء متعدد اللغات | Alibaba Qwen3 Max | أداء قوي لغير الإنجليزية |
| الرياضيات والاستدلال الرسمي والتحليل المنظم | Zhipu GLM-5 | أفضل جودة في سلسلة التفكير |
نمط توجيه عملي متعدد النماذج
بدل اختيار نموذج واحد لكل شيء، استخدم توجيهًا بسيطًا:
function selectChineseLLM({
inputTokens,
outputHeavy,
multilingual,
requiresFormalReasoning,
stableSystemPrompt,
codingAgent
}) {
if (inputTokens > 300_000) {
return "xiaomi-mimo-v2.5-pro";
}
if (requiresFormalReasoning) {
return "zhipu-glm-5";
}
if (codingAgent && stableSystemPrompt) {
return "moonshot-kimi-k2.6";
}
if (multilingual) {
return "alibaba-qwen3-max";
}
if (outputHeavy) {
return "deepseek-v4-pro";
}
return "deepseek-v4-pro";
}
ثلاثة أنماط تستحق التطبيق:
- توجيه بنموذجين: وجّه 70 إلى 85% من الحركة إلى DeepSeek V4-Pro، واحتفظ بنموذج ثانٍ للحالات الصعبة.
- تقسيم السياق الطويل: أرسل السياقات القصيرة إلى DeepSeek والطويلة إلى MiMo.
- توحيد بادئات الذاكرة المؤقتة: ثبّت مطالبات النظام حتى تستفيد من cache hits بغض النظر عن المزود.
ملاحظات الجودة والمعايير
التسعير وحده لا يكفي. وفقًا لـ Artificial Analysis، تتجمع النماذج الخمسة ضمن 5 إلى 10 نقاط مئوية من بعضها في معظم المعايير العامة.
الفروق المهمة:
- DeepSeek V4-Pro: قوي في البرمجة، مع SWE-bench Pro حوالي 55%، والاستدلال GPQA حوالي 90%. توجد فجوة طفيفة أمام GPT-5.5 في مهام الوكلاء طويلة المدى.
- MiMo V2.5 Pro: قوي في استرجاع السياق الطويل، مع دقة إبرة تزيد عن 95% عند 800 ألف. متوسط في البرمجة.
- Qwen3 Max: أفضل أداء لغير الإنجليزية وجودة إنتاج عامة قوية.
- Kimi K2.6: قوي في الالتزام بتنسيق استدعاء الأدوات، خصوصًا استدعاء الأدوات المتوازية.
- GLM-5: أفضل جودة استدلال بسلسلة التفكير في هذه المجموعة.
قبل الالتزام، شغّل تقييمًا داخليًا من 100 عينة على الأقل من حركة المرور الحقيقية لديك.
اختبار النماذج الخمسة باستخدام Apidog
يتطلب نشر إنتاج متعدد النماذج أداة اختبار متعددة المزودين. يتعامل Apidog مع واجهات برمجة التطبيقات الصينية الخمسة من مساحة عمل واحدة، لأن جميعها تقبل أجسام طلبات OpenAI Chat Completions مع اختلافات توافق بسيطة.
سير العمل المقترح:
-
أنشئ بيئة واحدة لكل مزود في Apidog:
api.deepseek.complatform.xiaomimimo.com- Alibaba Cloud Model Studio
api.moonshot.cnopen.bigmodel.cn
استورد مخطط OpenAI Chat Completion مرة واحدة.
بدّل
baseUrlحسب البيئة.شغّل نفس حالة الاختبار عبر النماذج الخمسة.
-
قارن:
- جودة الرد.
- عدد الرموز.
- زمن الاستجابة.
- شكل
tool_calls. - صلاحية JSON عند استخدام Structured Output.
مثال جسم طلب موحد:
{
"model": "{{model}}",
"messages": [
{
"role": "system",
"content": "أنت مساعد برمجي يجيب بإيجاز ويعيد JSON صالحًا عند الطلب."
},
{
"role": "user",
"content": "لخّص هذا المستند وحدد المخاطر التقنية الرئيسية."
}
],
"temperature": 0.2
}
يمكنك تحميل Apidog، استيراد حالات الاختبار، والحصول على مقارنة عملية للنماذج الخمسة في أقل من خمس عشرة دقيقة. نفس سير العمل مفيد مع: تخفيض DeepSeek V4-Pro الدائم، تكلفة MiMo V2.5، تسعير Kimi K2.
إلى أين تتجه حرب الأسعار التالية
تحرك الحد الأدنى للأسعار مرتين في مايو. من المرجح أن تظهر خطوات أخرى قبل نهاية الربع الثالث:
- استجابة Qwen: Alibaba نادرًا ما تبدأ التخفيضات، لكنها غالبًا تلحق بها خلال أسابيع. قد تظهر مراجعة لـ Qwen3 Max أو إعلان Qwen 3.8 بحلول يوليو.
- استجابة GLM: زيادة GLM-5 بنسبة 30% تبدو مخالفة لاتجاه السوق. قد يظهر GLM-5.2 بتخفيض هيكلي.
- تبسيط Kimi: التسعير المتدرج حسب السياق يزداد صعوبة في سوق يتجه إلى الأسعار الثابتة. قد توحّد Moonshot سعر K2.6 ليتماشى مع هيكل MiMo.
خطوات تنفيذية الآن
-
استخرج من سجلاتك:
- متوسط رموز الإدخال.
- متوسط رموز الإخراج.
- أطول 5% من الطلبات.
- نسبة البادئات المتكررة.
-
طبّق مصفوفة الاختيار:
- قصير ورخيص: DeepSeek.
- طويل جدًا: MiMo.
- أدوات ووكلاء ببادئة ثابتة: Kimi.
- متعدد اللغات: Qwen.
- استدلال حساس: GLM.
شغّل مجموعة اختبار انحدار عبر جميع المزودين باستخدام Apidog.
لا تربط التطبيق بمزود واحد. اجعل اختيار النموذج طبقة توجيه قابلة للتغيير.
الحد الأدنى للأسعار لم يتوقف عن الانخفاض بعد. صمّم طبقة LLM لديك بحيث تستطيع تبديل النموذج خلال ساعات، لا أسابيع.

Top comments (0)