DEV Community

Cover image for ما هو نموذج Kimi K2.6؟ شرح نموذج Moonshot AI المفتوح بـ 1 تريليون معلمة
Yusuf Khalidd
Yusuf Khalidd

Posted on • Originally published at apidog.com

ما هو نموذج Kimi K2.6؟ شرح نموذج Moonshot AI المفتوح بـ 1 تريليون معلمة

أطلقت Moonshot AI نموذج Kimi K2.6 مع وعود قوية حول البرمجة مفتوحة المصدر، والتنفيذ الطويل، وأسراب الوكلاء. تدعم النتائج هذه الوعود: 80.2% على SWE-Bench Verified، و96.4% على AIME 2026، و90.5% على GPQA-Diamond، و73.1% على OSWorld-Verified. كل الأرقام من الإعلان الرسمي على kimi.

جرّب Apidog اليوم

في هذه المقالة، ستجد شرحًا عمليًا لـ Kimi K2.6، كيف يغيّر معمارية Agent Swarm من قدرات النماذج، مقارنة معيارية مع GPT-5.4 وClaude 4.6، وخطوات مباشرة للبدء في استخدامه.

💡هل تريد اختبار Kimi K2.6 على واجهات برمجة التطبيقات؟ يهيئ Apidog نقطة نهاية Moonshot/Kimi متوافقة مع OpenAI داخل مساحة عمل مرئية. استورد لمرة واحدة، خزّن رمز Bearer، فعّل الدردشة المتدفقة، استدعَ الأدوات وطلبات الرؤية مع سجل كامل. يمكنك تحميل Apidog مجانًا.

ملخص (TL;DR)

  • الإصدار: Moonshot AI، أبريل 2026، مفتوح المصدر (الأوزان على Hugging Face، API على platform.kimi.ai).
  • المعمارية: Mixture-of-Experts (MoE) بمعاملات 1T، و32 مليار نشط/توكن، وسياق 262,144 توكن.
  • حد إخراج التفكير: حتى 98,304 توكن.
  • Agent Swarm: حتى 300 وكيل فرعي، 4,000+ خطوة متزامنة (3× سعة K2.5).
  • المقاييس البارزة: SWE-Bench Verified 80.2%، Terminal-Bench 2.0 بنسبة 66.7%، AIME 2026 بنسبة 96.4%، HLE-Full (أدوات) بنسبة 54%، OSWorld-Verified بنسبة 73.1%.
  • الواجهات: دردشة kimi.com، تطبيق Kimi، Kimi Code، API، أوزان مفتوحة.

Kimi K2.6 في فقرة واحدة

Kimi K2.6 هو نموذج مفتوح المصدر من Moonshot AI للبرمجة المتقدمة، وتنفيذ طويل الأمد، وأسراب الوكلاء. متاح على kimi.com، تطبيق Kimi، Kimi Code، وواجهة API عبر platform.kimi.ai. لأول مرة، يسمح النموذج بتنسيق 300 وكيل فرعي و4,000+ خطوة متزامنة، لجلسات تستمر أيامًا. إذا استخدمت Qwen 3.6 (دليل OpenRouter) أو Qwen3.5-Omni لعمليات API، ستجد Kimi K2.6 مكملًا قويًا مع تركيز على الوكلاء.

صورة

نشرت Moonshot جدول مقاييس كامل في إعلان Kimi K2.6. أهم النتائج:

البرمجة

المعيار Kimi K2.6
SWE-Bench Verified 80.2%
SWE-Bench Multilingual 76.7%
SWE-Bench Pro 58.6%
Terminal-Bench 2.0 66.7%
  • SWE-Bench Verified بنسبة 80.2% يعادل أو يتفوق على Claude 4.6، مع أوزان مفتوحة.
  • Terminal-Bench 2.0 بنسبة 66.7% (قفزة 15.9 نقطة عن K2.5) تعكس موثوقية أعلى في أوامر الشيل ومعالجة الملفات.

استخدام الوكيل والأدوات

المعيار Kimi K2.6
HLE-Full (مع الأدوات) 54.0%
BrowseComp 83.2% (86.3% مع Agent Swarm)
DeepSearchQA (F1) 92.5%
Toolathlon 50.0%
Claw Eval (pass@3) 80.9%
OSWorld-Verified 73.1%

التفكير والمعرفة

المعيار Kimi K2.6
AIME 2026 96.4%
HMMT 2026 (فبراير) 92.7%
GPQA-Diamond 90.5%
IMO-AnswerBench 86.0%
  • AIME 2026 بنسبة 96.4% نتيجة شبه مثالية في معيار رياضيات تنافسي حديث.

الرؤية

المعيار Kimi K2.6
MathVision (مع بايثون) 93.2%
V* (مع بايثون) 96.9%
MMMU-Pro 79.4%
CharXiv (RQ، مع بايثون) 86.7%
  • نتائج "مع بايثون" تظهر كيف أصبح استدعاء الأدوات جزءًا من مهام الرؤية: النموذج يقرأ شكلًا، يكتب كود بايثون، يحسب ويجيب بنفس الجلسة.

سرب الوكلاء: قفزة هيكلية عملية

Agent Swarm هو التحوّل الهندسي الأهم في K2.6. النموذج ينسق حتى 300 وكيل فرعي عبر 4,000+ خطوة (مقابل 100 وكيل و1,500 خطوة في K2.5).

ثلاث نقاط حول طريقة العمل:

  1. تجزئة المهام غير المتجانسة: النموذج لا يكرر نفسه، بل يقسم العمل لمهام فرعية (برمجة، بحث، رؤية، تخطيط) ويوجهها للمتخصص المناسب.
  2. ذكاء تركيبي: الوكلاء الفرعيون يتواصلون عبر حالة مشتركة وينتجون مستندات، مواقع أو جداول بيانات من جلسة واحدة. يشبه طريقة تنسيق وكيل Hermes.
  3. تحويل المستند إلى مهارة: يمكن للنموذج استيعاب وثيقة تصميم كاملة والتصرف بناءً عليها كما لو كانت معرفة ضمنية.

أمثلة عملية من إعلان Kimi

  • تحسين استدلال Qwen3.5-0.8B على Mac: 12+ ساعة عمل، 4,000+ استدعاء أداة، 14 تكرار، زيادة من 15 إلى 193 توكن/ثانية.
  • ضبط محرك مالي للتبادل: 13 ساعة، 1,000+ استدعاء أداة، 4,000+ سطر كود تم تعديله، زيادة إنتاجية بنسبة 185%.
  • تشغيل بنية تحتية مستقلة لـ5 أيام: معالجة مهام متعددة الخيوط، واستجابة للحوادث بدون إشراف بشري.

إذا لاحظت وكلاء برمجة ينهارون بعد 20 استدعاء أداة، ستلاحظ هنا كيف يقيس Kimi النجاح بساعات العمل، لا بعدد المعاملات فقط.

كيف تصمد المعمارية

Mixture of Experts

K2.6 هو نموذج MoE بمعاملات 1T و32 مليار نشط/توكن، يوفر قدرة فائقة بتكلفة استدلال قريبة من نموذج كثيف 32B. للمقارنة، نفس مقايضة النماذج مثل GLM-5V Turbo API.

سياق طويل: 262,144 توكن

نافذة السياق 262,144 توكن. الحد الأقصى للإخراج 98,304 توكن (مهام التفكير). عمليًا، يمكنك تضمين:

  • قاعدة بيانات متوسطة كاملة مع مساحة لمسار الوكيل
  • وثيقة قانونية أو بحثية كاملة مع مساحة لأسئلة وأجوبة متعددة الأدوار
  • سجل استدعاء أدوات لوكلاء يعملون لأيام متواصلة

تمت إعادة بناء مكوّنات الانتباه في K2.6 لاستقرار السياق الطويل مقارنة بـ K2.5.

إعدادات أخذ العينات الافتراضية

المدونة توصي باستعمال temperature 1.0 وtop-p 1.0، على عكس النماذج الأخرى التي تفضل حرارة منخفضة. K2.6 مضبوط لإخراج موثوق بدرجات حرارة مرتفعة.

مجموعات Claw: طبقة الوكلاء المتعددين فوق النموذج

مجموعات Claw معاينة بحثية تتيح تعاون وكلاء وبشر على نفس المهمة عبر أجهزة مختلفة. القدرات تشمل:

  • مطابقة ديناميكية للمهام حسب أدوات التخصص
  • كشف الأعطال وإعادة تعيين المهام تلقائيًا
  • نشر عبر الأجهزة
  • نقاط تحقق لتدخل البشر

Claw Eval بنسبة 80.9% (pass@3) تقيس درجة موثوقية K2.6 في هذا السياق. بنية مناسبة لمن يبني فرق وكلاء مستقلين كما في شركة وكيل Paperclip.

التطوير الموجه بالتصميم والوكلاء الاستباقيون

K2.6 قادر على توليد واجهات أمامية كاملة، وليس مجرد إكمال كود دردشة. أمثلة عملية:

  • توليد كامل المكدس (مصادقة، قواعد بيانات، معاملات)
  • دمج أدوات توليد الصور والفيديو ضمن مسارات الوكلاء
  • رسوم متحركة تفاعلية وعناصر جاهزة للإنتاج

الوكلاء الاستباقيون يعملون على مدار الساعة مع OpenClaw وHermes، لتنسيق تطبيقات متعددة في الخلفية، مشابه لما يوفره Google Agent Smith أو بناء Claude Code الخاص بك.

Kimi K2.6 مقابل النماذج المغلقة الرائدة

من الجدول الرسمي:

المهمة K2.6 GPT-5.4 Claude 4.6 Gemini 3.1 K2.5
HLE-Full (أدوات) 54.0 52.1 53.0 51.4 50.2
BrowseComp 83.2 82.7 83.7 85.9 74.9
Terminal-Bench 2.0 66.7 65.4 65.4 68.5 50.8
SWE-Bench Pro 58.6 57.7 53.4 54.2 50.7

النقاط العملية:

  1. K2.6 يتفوق أو يتعادل في 3 من 4 مهام (HLE-Full، SWE-Bench Pro).
  2. Gemini 3.1 يتصدر في Terminal-Bench وBrowseComp (للتصفح أو أوامر الطرفية).
  3. K2.6 متوفر بأوزان مفتوحة؛ النماذج المغلقة لا توفر ذلك.

أين يتوفر Kimi K2.6

دردشة kimi.com

واجهة Kimi للمستهلكين هي أسرع طريقة لتجربة K2.6. سجل دخولك، اختر K2.6، استعمل الدردشة، وضع الوكيل، سرب الوكلاء، والرؤية. راجع دليل استخدام Kimi K2.6 مجانًا.

تطبيق Kimi

تطبيق الهاتف (iOS، Android) يطابق تجربة الويب مع دعم الصوت وإشعارات دفع لمهام طويلة.

Kimi Code

Kimi Code منصة برمجة طرفية أصلية. يدير ملفاتك المحلية، يقوم بالتعهيدات والاختبارات، ويدمج Agent Swarm. للمقارنة مع الوكلاء البرمجيين: Cursor Composer 2.

واجهة برمجة التطبيقات (API)

الـ API متوافقة مع OpenAI.

الأوزان المفتوحة على Hugging Face

الأوزان متوفرة على Hugging Face برخصة MIT معدلة. الكمّ المجتمعي (ubergarm GGUF، unsloth) يسمح بالتشغيل محليًا على وحدات H100 وما شابه.

كيف تم تدريب K2.6 (ما كشفت عنه Moonshot)

لا تفاصيل كاملة عن تدريب K2.6، لكن المؤشرات الأساسية:

  • الاستقرار الطويل: تدريب الوكلاء على جلسات 12–13 ساعة، مع تفادي فشل الاستدعاءات بعد مئات الأدوات (كما حدث في K2.5).
  • موثوقية استدعاء الأدوات: CodeBuddy يحقق 96.60% نجاح استدعاء أداة.
  • تدريب الأسراب التركيبية: تم تدريب وكلاء فرعيين بأدوار متعددة (مخطط، مبرمج، باحث، مراجع).
  • ربط الرؤية والكود: النتيجة العالية في MathVision مع بايثون تدل على تدريب مشترك متعدد الوسائط.

من يجب أن يهتم

اختر Kimi K2.6 إذا كنت تبني:

  • وكلاء برمجة طويلة الأمد: التشغيل 12 ساعة و4,000 خطوة مدعوم معماريًا.
  • أنظمة متعددة الوكلاء: Agent Swarm وClaw يجعلون التنسيق سهلاً بدون كتابة من الصفر.
  • إنتاج بأوزان مفتوحة: تحكم كامل أو ضبط مخصص حسب الحاجة.
  • API عالي الإنتاجية: تكلفة MoE أقل من النماذج المغلقة، وAPI متوافق مع OpenAI.

التزم بالنماذج المغلقة إذا كنت بحاجة إلى:

  • محاذاة صارمة للسلامة: Claude 4.6 يتفوق في الاستجابة للسياسات.
  • زمن استجابة دردشة أقل من ثانية: Agent Swarm مناسب للعمليات الطويلة.
  • اتفاقيات مستوى الخدمة (SLAs) مغلقة: الدعم من المختبرات الكبرى أولوية في بعض القطاعات.

كيف تختبر Kimi K2.6 في خمس دقائق باستخدام Apidog

بعد الحصول على مفتاح API من Moonshot/Kimi، اتبع الخطوات التالية مع Apidog:

  1. أنشئ بيئة:
   BASE_URL = https://api.moonshot.ai/v1
   KIMI_API_KEY = sk-...
Enter fullscreen mode Exit fullscreen mode
  1. أضف طلب جديد:
   POST {{BASE_URL}}/chat/completions
Enter fullscreen mode Exit fullscreen mode
  1. أضف الرؤوس (Headers):
   Authorization: Bearer {{KIMI_API_KEY}}
   Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode
  1. الجسم (Body):
   {
     "model": "kimi-k2.6",
     "messages": [{"role": "user", "content": "لخص إعلان Kimi K2.6."}],
     "stream": true
   }
Enter fullscreen mode Exit fullscreen mode
  1. اضغط Send، وشاهد النتائج تتدفق.

Apidog يدير أيضًا سجل الطلبات، إعادة تشغيل استدعاء الأدوات الفاشلة، التحقق من صحة المخطط مع OpenAI، مشاركة المفاتيح مع الفريق، وتكامل VS Code للاختبار داخل المحرر. إذا كنت تستخدم Postman، راجع دليل اختبار API بدون Postman 2026.

الأسئلة الشائعة

هل Kimi K2.6 مفتوح المصدر؟

الأوزان مفتوحة بموجب ترخيص MIT معدل (moonshotai/Kimi-K2.6). بيانات وكود التدريب غير متاحين. النموذج يعتبر "ذو أوزان مفتوحة".

ما الفرق بين Kimi K2.6 وK2.5؟

زيادة ملموسة في كل معيار. راجع جدول المعايير الرسمي: +3.8 HLE-Full، +8.3 BrowseComp، +15.9 Terminal-Bench 2.0، +7.9 SWE-Bench Pro، +20.5 Claw Eval، وزيادة 3× في Agent Swarm.

ما نافذة سياق Kimi K2.6؟

262,144 توكن. الحد الأقصى للتوليد لمهام التفكير 98,304 توكن.

هل يمكن تشغيل Kimi K2.6 محليًا؟

نعم مع أجهزة قوية. نموذج 1T MoE يحتاج عدة H100. الإصدارات المكمّمة (4بت، 3بت) للفرق الصغيرة مع بعض فقدان الجودة. راجع دليل الوصول المجاني.

هل يدعم Kimi K2.6 استدعاء الأدوات؟

نعم. API مطابق لـ OpenAI Tool Calling. Agent Swarm يدير الاستدعاءات المتوازية.

ما الفرق بين Kimi K2.6 وKimi K2.6 Thinking؟

K2.6 للوكيل السريع؛ K2.6 Thinking يكشف تسلسل التفكير قبل الإجابة. استخدم الأخير للرياضيات، تصحيح الأخطاء أو التخطيط المعقد.

كيف أصل إلى Kimi K2.6 مجانًا؟

دردشة الويب kimi.com مجانية بحصة يومية. Cloudflare Workers AI يقدم طبقة مجانية. الاستضافة الذاتية عبر أوزان Hugging Face مجانية بعد اقتناء الأجهزة. تفاصيل الكمّ في الدليل.

كيف يقارن Kimi K2.6 بالنماذج ذات الأوزان المفتوحة الأخرى؟

يتفوّق في البرمجة والوكلاء مقابل Qwen 3.6 وQwen3.5-Omni؛ Qwen يتفوق بالمتغيرات متعددة اللغات والصغيرة. مقابل DeepSeek V3.x، يتفوق K2.6 بتنسيق الوكلاء.

الملخص

Kimi K2.6 هو النموذج ذو الأوزان المفتوحة الأكثر جاهزية للإنتاج لوكلاء البرمجة والعمل الطويل. 300 وكيل، تنفيذ 4,000 خطوة، نافذة سياق 262K وأوزان مفتوحة تجعله أداة فريدة بين النماذج الحديثة.

منشور Moonshot يصفه بأنه قمة التطوير في أعمال الوكلاء مفتوحة المصدر، والمعايير تؤكد ذلك.

إذا كنت تبني وكيل برمجة أو مساعد بحث طويل أو نظام متعدد الوكلاء، Kimi K2.6 يجب أن يكون ضمن قائمتك المختصرة. احصل على مفتاح من platform.kimi.ai، افتح Apidog، وأرسل أول طلب. ثم تابع مع أدلة API وطرق الوصول المجاني.

Top comments (0)