انخفض سعر واجهة برمجة التطبيقات Xiaomi MiMo V2.5 إلى سعر ثابت قدره 1 دولار لكل مليون رمز إدخال و3 دولارات لكل مليون رمز إخراج في 27 مايو 2026، وجعل الفريق هذا السعر دائمًا. عمليًا، اختفت طبقة السياق الطويل القديمة التي كانت ترفع السعر بقوة بعد 256 ألف رمز. الآن لديك سعر واحد بغض النظر عن طول السياق، وهذا يجعل MiMo V2.5 أحد أرخص نماذج الإنتاج التي تدعم سياق 1 مليون رمز.
ملخص سريع
- تسعير Xiaomi MiMo V2.5 الدائم اعتبارًا من 27 مايو 2026: 1.00 دولار للإدخال، 3.00 دولارات للإخراج، 0.20 دولار للرموز المخزنة مؤقتًا لكل مليون رمز، مع نافذة سياق بحجم 1 مليون رمز.
- ادعاء "خصم يصل إلى 99%" ينطبق على طبقة السياق الطويل. الجدول السابق كان يتصاعد بعد 256 ألف رمز إدخال، بينما يلغي السعر الثابت الجديد هذا المضاعف.
- حصل عملاء خطة الرموز (Token Plan) على زيادة في الحصة من 5x إلى 8x مع إعادة تعيين كامل للرصيد المستخدم ضمن فترة الصلاحية.
- التخفيض دائم وليس ترويجيًا. يستخدم إشعار شاومي عبارة "تجديد دائم لنظام تسعير النموذج بالكامل".
- السياق الأوسع: شاومي هي ثاني مختبر صيني يعلن تخفيضًا دائمًا على مستوى الطبقة الرائدة هذا الأسبوع، بعد أن جعلت DeepSeek نموذج V4-Pro دائمًا بسعر ربع سعر القائمة قبل ثلاثة أيام.
ما الذي تغير في 27 مايو 2026
يوضح إشعار تحديث الأسعار الرسمي من شاومي ثلاثة تغييرات دخلت حيز التنفيذ في الساعة 00:00 بتوقيت بكين يوم 27 مايو، أي 16:00 UTC يوم 26 مايو.
1. تسعير موحد عبر نوافذ السياق
كان جدول MiMo V2.5 القديم يستخدم أسعارًا متدرجة:
- سعر أساسي للمطالبات حتى 32 ألف رمز إدخال.
- مضاعف للسياق بين 32 ألف و256 ألف.
- سعر أعلى بكثير فوق 256 ألف.
الجدول الجديد يستخدم رقمًا واحدًا لكل نوع رمز. هذا يعني أن تطبيقات السياق الطويل لم تعد تدفع "ضريبة سياق طويل".
2. التخفيض دائم، وليس حملة مؤقتة
يستخدم الإشعار الرسمي عبارات مثل "تخفيض دائم في الأسعار" و"تجديد دائم لنظام تسعير النموذج بالكامل". لا يوجد تاريخ انتهاء أو بند تراجع، لذلك يمكن التعامل معه كسعر رسمي جديد عند إعادة حساب تكاليف الإنتاج.
3. إعادة تعيين مكافآت خطة الرموز
إذا كنت تستخدم خطة رموز مدفوعة مسبقًا من شاومي، فقد زاد رصيدك من 5 إلى 8 مرات، وتمت استعادة الرصيد الذي استهلكته بالفعل ضمن فترة الصلاحية. لم يتم تمديد فترة الصلاحية نفسها، لذلك حصلت الخطط الحالية على رصيد إضافي، وليس وقتًا إضافيًا.
ينطبق عنوان "خصم يصل إلى 99%" تحديدًا على نطاق السياق الطويل. كان السعر السابق للمدخلات فوق 256 ألف رمز مرتفعًا بما يكفي لجعل الانتقال إلى 1 دولار/مليون تخفيضًا يتجاوز 90%. أما أعباء العمل التي كانت ضمن الطبقة الأساسية، فالتخفيض أصغر لكنه لا يزال مؤثرًا.
ورقة الأسعار الدائمة الجديدة
الأسعار لكل مليون رمز، بالدولار الأمريكي:
| النموذج | الإدخال | الإخراج | المخزن مؤقتًا | السياق |
|---|---|---|---|---|
| MiMo V2.5 Pro | $1.00 | $3.00 | $0.20 | 1 مليون رمز |
| MiMo V2 Flash | ~$0.10 | ~$0.40 | $0.02 | 256 ألف رمز |
ملاحظات مهمة عند التخطيط للتكلفة:
- سعر التخزين المؤقت لـ V2.5 Pro هو 0.20 دولار/مليون، أي أرخص 5 مرات من الإدخال العادي. هذا أقل عدوانية من خصم DeepSeek، لكنه لا يزال مفيدًا للمطالبات النظامية المتكررة.
- نافذة السياق بحجم 1 مليون رمز هي النقطة العملية الأهم. كثير من النماذج الرائدة المستضافة في الولايات المتحدة تتوقف عند 200 ألف إلى 400 ألف رمز.
- يشير الإشعار إلى متغيرات V2.5 Omni وTTS لكنه لا يفصل أسعارها. تحقق منها بشكل منفصل على المنصة.
للاطلاع على تسعير V2-Pro الأقدم كنقطة مرجعية، راجع دليل تسعير واستخدام API لـ MiMo V2-Pro وOmni.
ما يقدمه MiMo V2.5 بخلاف السعر
إعلان 27 مايو هو حدث تسعير، لكن V2.5 نفسه يمثل ترقية عن V2-Pro الذي أُطلق في أبريل. عند تقييمه تقنيًا، راقب هذه النقاط:
- سياق عملي أطول: يحتفظ V2.5 Pro بنافذة 1 مليون رمز، مع تحسين جودة الاسترجاع في نطاق 200 ألف إلى 800 ألف رمز. تحافظ دقة "الإبرة في كومة القش" على أكثر من 95% حتى 800 ألف رمز.
- امتثال أفضل لتنسيق استدعاء الأدوات: عانى V2-Pro من مشكلات في استدعاءات الأدوات المتوازية وJSON المشوه داخل الاستجابات المتدفقة. يقلل V2.5 هذه الأعطال، لكن لا يلغي الحاجة إلى التحقق من مخطط JSON.
- مجموعة تدريب أحدث: تم تدريب V2.5 باستخدام بيانات حتى الربع الأول من 2026، أي أحدث بحوالي ثلاثة أشهر من V2-Pro.
عمليًا، اجمع بين السعر الأرخص، ونافذة 1 مليون رمز، واختبار جودة الاسترجاع قبل نقل أعباء العمل الحساسة إلى الإنتاج.
كيف يقارن MiMo V2.5 ببقية المجال
المقارنة المفيدة ليست مع الإصدار القديم فقط، بل مع خيارات API الرائدة في مايو 2026:
| النموذج | الإدخال، دولار/مليون رمز | الإخراج، دولار/مليون رمز | السياق |
|---|---|---|---|
| Xiaomi MiMo V2.5 Pro | $1.00 | $3.00 | 1 مليون |
| DeepSeek V4-Pro | $0.435 | $0.87 | 128 ألف |
| GPT-5.5 | $5.00 | $30.00 | 200 ألف |
| Claude Opus 4.7 | $3.00 | $15.00 | 200 ألف |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | 1 مليون |
الخلاصة التقنية:
- DeepSeek V4-Pro أرخص لكل رمز. إذا كان معيارك الوحيد هو سعر الرمز، فهو أرخص بحوالي 2.3 مرة على الإدخال و3.5 مرة على الإخراج.
- MiMo V2.5 أفضل عندما تحتاج سياق 1 مليون رمز. Gemini 3.5 Flash هو الخيار الآخر في الجدول بسياق 1 مليون، لكنه أغلى على الإدخال والإخراج.
- MiMo V2.5 أرخص من GPT-5.5 بخمس مرات على الإدخال وعشر مرات على الإخراج، مع أداء معياري مماثل وفقًا لـ Artificial Analysis.
للاطلاع على جانب DeepSeek من المقارنة، راجع تخفيض سعر DeepSeek V4-Pro بنسبة 75% أصبح دائمًا.
ثلاثة أعباء عمل، ثلاث فواتير جديدة
استخدم الأرقام التالية كنموذج سريع لإعادة تسعير أعباء العمل لديك.
1. RAG للمستندات الطويلة
السيناريو:
- 50,000 استعلام يوميًا.
- 800 ألف رمز سياق لكل استعلام.
- 1,000 رمز إخراج لكل إجابة.
التكلفة التقريبية:
- طبقة السياق الطويل القديمة لـ MiMo V2.5، بمعدل فعال مقدر بـ 50 دولار/مليون: حوالي 60,000 دولار/شهر.
- السعر الثابت الجديد: حوالي 1,225 دولار/شهر.
الوفورات: حوالي 58,775 دولار/شهر.
2. وكيل مراجعة الأكواد
السيناريو:
- 5,000 طلب سحب يوميًا.
- 30 ألف رمز سياق مستودع.
- 2,000 رمز إخراج للتعليقات.
التكلفة التقريبية:
- GPT-5.5: حوالي 5,250 دولار/شهر.
- MiMo V2.5: حوالي 510 دولارات/شهر.
الوفورات: حوالي 4,740 دولار/شهر.
3. روبوت دعم العملاء
السيناريو:
- 200,000 دورة يوميًا.
- مطالبة نظامية 4 آلاف رمز.
- استجابة 300 رمز.
التكلفة التقريبية:
- Claude Opus 4.7: حوالي 11,250 دولار/شهر.
- MiMo V2.5: حوالي 805 دولارات/شهر.
الوفورات: حوالي 10,445 دولار/شهر.
أكبر مكسب هنا هو حالة RAG للمستندات الطويلة. قبل التخفيض، كانت كثير من الفرق تضطر إلى التلخيص أو التجزئة العدوانية لتقليل التكلفة. الآن يمكنك اختبار إرسال المستندات الطويلة كاملة إلى النموذج عندما يكون ذلك أبسط وأكثر دقة.
ملاحظة عملية حول إصابات التخزين المؤقت
سعر الإدخال المخزن مؤقتًا هو 0.20 دولار/مليون بدلًا من 1.00 دولار/مليون. هذا خصم 5x، ويصبح مهمًا إذا كانت لديك بادئة ثابتة مثل system prompt أو تعليمات أدوات.
مثال:
- مطالبة نظامية: 6,000 رمز.
- 80,000 دورة دردشة يوميًا.
- متوسط رسالة المستخدم: 250 رمز إدخال.
- متوسط الاستجابة: 600 رمز إخراج.
بدون إصابات التخزين المؤقت:
80,000 × 6,250 × $1.00 / 1,000,000
= $500 يوميًا على الإدخال
مع إصابة تخزين مؤقت بنسبة 60% على بادئة المطالبة النظامية:
80,000 × (250 × $1.00 + 6,000 × (0.6 × $0.20 + 0.4 × $1.00)) / 1,000,000
≈ $271 يوميًا
هذا تخفيض يقارب 46% على الإدخال.
لتحسين فرص إصابات التخزين المؤقت:
- ثبّت مطالبة النظام ولا تعد ترتيبها عند كل طلب.
- ضع السياق المتكرر في بادئة ثابتة.
- لا تضف timestamps أو request IDs داخل البادئة.
- رتّب نتائج RAG بشكل ثابت عندما يكون ذلك ممكنًا.
متى يكون MiMo V2.5 الخيار الصحيح
استخدم MiMo V2.5 عندما تكون قيمة السياق الطويل أعلى من قيمة أقل زمن استجابة ممكن.
مناسب لـ
- RAG للمستندات الطويلة: عقود، ملفات PDF داخلية، أرشيفات دعم، تقارير مالية.
- وكلاء قواعد الأكواد: مراجعة مستودعات كبيرة، تحليل معماريات، إعادة هيكلة واسعة.
- معالجة مستندات عالية الحجم: حيث تحتاج تسعيرًا يمكن التنبؤ به وسياقًا كبيرًا.
- مطالبات نظامية متكررة: للاستفادة من التخزين المؤقت. راجع كيف يعزز التخزين المؤقت للمطالبات أداء نماذج LLM ويقلل التكاليف.
أقل ملاءمة لـ
- الدردشة التفاعلية شديدة الحساسية للكمون: MiMo V2.5 Pro ليس الأسرع في إخراج أول رمز. إذا كنت تبني إكمالًا تلقائيًا أو دردشة أقل من ثانية، فاختبر DeepSeek V4-Flash أو Gemini 3.5 Flash كبدائل.
تحذيرات قبل الإنتاج
- إقامة البيانات: تمر المكالمات عبر بنية شاومي في الصين، لذلك راجع متطلبات الامتثال والشراء.
- الموثوقية: سجل تشغيل API لشاومي أقصر من النماذج الرائدة المستضافة في الولايات المتحدة. للإنتاج المدعوم باتفاقية مستوى خدمة، فكّر في التوجيه عبر OpenRouter أو مجمع آخر.
- استدعاء الوظائف: التوافق مع OpenAI جيد على مستوى المخطط، لكن اختبر حالات streaming tool arguments واستدعاءات الأدوات المتوازية قبل النشر.
لخلفية الإصدار السابق، راجع شاومي أطلقت للتو نموذج الذكاء الاصطناعي الخاص بها، وهو مجاني على OpenRouter. وللطبقة المجانية، راجع برنامج Xiaomi MiMo Orbit المجاني لـ 100 ألف رمز.
اختبار MiMo V2.5 باستخدام Apidog
توافق MiMo V2.5 مع OpenAI جيد، لكنه ليس مثاليًا. قبل تحويل حركة الإنتاج، اختبر التكامل كما تختبر أي مزود LLM جديد.
يمكنك استخدام Apidog لتوجيه طلب Chat Completions إلى:
https://platform.xiaomimimo.com/v1
مع مفتاح API الخاص بـ MiMo، ثم تنفيذ الاختبارات التالية:
-
تسجيل استجابات ذهبية
- شغّل عينات ثابتة على V2.5 Pro.
- خزّن الاستجابات المتوقعة.
- أعد تشغيلها عند تعديل المطالبات.
-
التحقق من tool_calls
- أضف تأكيدات JSON Schema.
- ركّز على وسيطات الأدوات المتدفقة.
- اختبر الاستدعاءات المتوازية للأدوات.
-
مقارنة نموذجية جنبًا إلى جنب
- شغّل نفس الدفعة على MiMo V2.5 ونموذجك الحالي.
- قارن الجودة، زمن الاستجابة، واستهلاك الرموز.
- استخدم نفس prompts لتجنب تحيز الاختبار.
خطوات إعداد سريعة:
1. نزّل Apidog.
2. استورد مخطط OpenAI Chat Completion.
3. غيّر Base URL إلى https://platform.xiaomimimo.com/v1.
4. أضف مفتاح MiMo API.
5. شغّل مجموعة اختبار من 100 عينة.
يمكنك تنزيل Apidog والبدء بنفس سير العمل الموضح في كيفية استخدام DeepSeek V4 API.
كيف تتشكل حرب أسعار LLM لعام 2026
MiMo V2.5 هو ثاني تخفيض دائم على مستوى الطبقة الرائدة من مختبر صيني في أسبوع واحد. جعلت DeepSeek نموذج V4-Pro دائمًا بسعر ربع سعر القائمة في 22 مايو. كما خفضت Kimi K2 في وقت سابق من الربع الأول، وانخفض سعر OpenAI O3 بنسبة 80% في فبراير.
النمط الحالي:
- المختبرات الصينية تنافس بقوة على السعر. هذه التخفيضات هيكلية وليست حملات قصيرة.
- المختبرات الأمريكية تنافس على القدرات والحزم. OpenAI وAnthropic تحافظان على أسعار أعلى مع ميزات مثل أوضاع التفكير، خوادم MCP، وسير عمل الوكلاء.
- فجوة المعايير أصبحت صغيرة بما يكفي لإعادة الاختبار. تضع المعايير العامة MiMo V2.5 ضمن نقاط مئوية أحادية الرقم من GPT-5.5 في كثير من مهام البرمجة والاستدلال وفقًا لـ Artificial Analysis.
لقراءة الصورة الكاملة:
- تخفيض سعر DeepSeek V4-Pro الدائم
- تسعير API لـ Kimi K2
- انخفاض أسعار OpenAI O3
- تكلفة Gemini 3.0 API
- التحليل الكامل لتكلفة Claude API
- معايير MiMo-7B-RL
ماذا تفعل الآن
تخفيض MiMo V2.5 ليس حيلة تسويقية. إنه إعادة تسعير دائمة لطبقة سياق 1 مليون رمز. إذا كنت تؤجل RAG للمستندات الطويلة، أو وكلاء الأكواد على مستوى المستودع، أو أي عبء عمل يتجاوز 200 ألف رمز بسبب التكلفة، فأعد الحساب.
خطوات عملية:
-
أعد تسعير أكبر ثلاثة أعباء عمل لديك
- احسب رموز الإدخال.
- احسب رموز الإخراج.
- افصل الرموز المخزنة مؤقتًا عن غير المخزنة.
-
شغّل تقييمًا من 100 عينة
- استخدم نفس المطالبات على MiMo V2.5 ونموذجك الحالي.
- قارن الجودة، زمن الاستجابة، والأخطاء البنيوية في JSON/tool calls.
-
ابنِ مجموعة اختبار انحدار
- استخدم Apidog لتثبيت اختباراتك.
- اجعل تبديل المزودين قرارًا مبنيًا على بيانات، وليس تجربة يدوية.
أرضية أسعار نماذج LLM تحركت مرة أخرى. ابنِ خطتك وفقًا لذلك.



Top comments (0)