Yusuf Khalidd

Posted on May 21 • Originally published at apidog.com

ما هو Qwen 3.7؟ نموذج الذكاء الاصطناعي الرائد الجديد من علي بابا

أطلق فريق Qwen التابع لـ Alibaba أحدث نماذجه الرائدة: Qwen3.7-Max-Preview. ظهر النموذج أولًا على لوحات المتصدرين العامة قبل الإعلان الرسمي عنه في قمة Alibaba Cloud لعام 2026، ثم بدأ الوصول إليه تدريجيًا عبر Alibaba Cloud. عمليًا، يهمك كمطوّر لأنه نموذج استدلال موجّه للمهام الطويلة والوكلاء، مع نافذة سياق تصل إلى مليون رمز.

جرّب Apidog اليوم

إذا كنت تبني تطبيقًا يعتمد على نموذج مثل Qwen 3.7، فالمشكلة ليست فقط “هل النموذج ذكي؟”. ستحتاج إلى تصميم طلبات API، اختبار الاستجابات، محاكاة المخرجات أثناء التطوير، والتحقق من سلوك التكامل قبل الإنتاج. هذا النوع من العمل هو ما صُمم له Apidog. في هذا المقال سنركّز على ما يقدمه Qwen 3.7 فعليًا، وكيف تقرر إن كان مناسبًا لمجموعتك التقنية.

خلاصة سريعة للمطورين

Qwen3.7-Max-Preview هو النموذج الرائد الحالي من Alibaba ضمن عائلة Qwen 3.7.
النموذج مغلق الوزن ومتاح حاليًا كإصدار Preview.
يدعم نافذة سياق تصل إلى مليون رمز.
مصمم لمهام الاستدلال والوكلاء: البرمجة، التخطيط، تشغيل الأدوات، وسلاسل المهام الطويلة.
سجّل 57 نقطة في مؤشر Artificial Analysis Intelligence Index، وقد أُبلغ أنه تصدّر تلك اللوحة عند الإطلاق.
سجّل حوالي 1,475 Elo في لوحة LM Arena النصية.
لم تُشحن أوزان مفتوحة المصدر لـ Qwen 3.7 حتى منتصف مايو 2026.

ما هو Qwen 3.7؟

Qwen 3.7 هو أحدث جيل من نماذج اللغة الكبيرة من Qwen، فريق الذكاء الاصطناعي التابع لـ Alibaba. الإصدار الأهم حاليًا هو Qwen3.7-Max-Preview، وتصفه Alibaba كنموذج متقدم للمهام الوكيلة والاستدلال متعدد الخطوات.

اسم Max يعني أنه الإصدار الأعلى ضمن العائلة. في أجيال Qwen السابقة، طرحت Alibaba عادةً نموذج Max كرائد، إلى جانب إصدارات أصغر أو أكثر قابلية للوصول. لكن حتى منتصف مايو 2026، الإصدار المؤكد من Qwen 3.7 هو Qwen3.7-Max-Preview فقط.

من ناحية الاستخدام، هذا ليس مجرد نموذج دردشة. الفكرة الأساسية هي تشغيل مهام طويلة نسبيًا مثل:

تحليل مستودع برمجي كامل.
كتابة أو تعديل كود عبر عدة ملفات.
تنفيذ خطوات متسلسلة باستخدام أدوات.
تلخيص مستندات طويلة.
تشغيل وكيل يتخذ قرارات على عدة مراحل.

ظهر النموذج على لوحة LM Arena النصية تقريبًا في 14 مايو 2026، ثم جاء الإعلان الرسمي في قمة Alibaba Cloud في 20 مايو. بدأ وصوله إلى منصة API الخاصة بـ Alibaba في 19 مايو. لذلك يجب التعامل مع الإصدار الحالي كنسخة مبكرة قابلة للتغيير.

تشكيلة إصدارات Qwen 3.7

الأهم هنا هو عدم افتراض ما لم تعلنه Alibaba بعد.

المؤكد حاليًا:

Qwen3.7-Max-Preview موجود ومتاح تدريجيًا.
هو نموذج استدلال رائد.
الأوزان ليست مفتوحة.

غير المؤكد حتى منتصف مايو 2026:

لا يوجد إعلان رسمي عن Qwen3.7-Plus.
لا توجد أوزان Qwen 3.7 مفتوحة المصدر على GitHub أو Hugging Face.
أي أحجام نماذج متداولة على الإنترنت يجب اعتبارها تخمينات حتى تؤكدها Alibaba.

الخلاصة العملية: عندما تقرأ “Qwen 3.7” اليوم، افترض أن المقصود غالبًا هو Qwen3.7-Max-Preview عبر خدمة مستضافة، وليس نموذجًا يمكنك تنزيله وتشغيله محليًا.

نافذة السياق: مليون رمز

وفقًا لـ Artificial Analysis، يدعم Qwen3.7-Max-Preview نافذة سياق تصل إلى مليون رمز. هذا يعني أن الطلب الواحد يمكن أن يحتوي على كمية كبيرة جدًا من النص: تعليمات، ملفات، محادثات، مستندات، أو كود.

استخدامات عملية لنافذة بهذا الحجم:

تمرير مستودع برمجي متوسط الحجم لتحليل البنية.
إدخال عدة ملفات PDF أو مواصفات تقنية في طلب واحد.
تحليل سجل محادثات طويل.
تنفيذ refactor يعتمد على فهم عدة ملفات معًا.
بناء وكيل يحتاج إلى ذاكرة سياقية طويلة أثناء المهمة.

لكن لا تستخدم مليون رمز افتراضيًا. هناك سببان:

التكلفة: كل رمز ترسله يدخل في الفوترة.
الدقة العملية: السياق الكبير لا يعني أن النموذج سيستخرج كل معلومة بنفس الموثوقية في كل مرة.

قاعدة عملية:

استخدم السياق الكامل فقط عندما تحتاج فعلاً إلى ربط معلومات كثيرة في قرار واحد.
وإلا، قلّص المدخلات، لخّصها، أو استخدم retrieval قبل إرسال الطلب.

مثال على استراتيجية أفضل:

بدل إرسال المستودع كاملًا:
1. استخرج الملفات المرتبطة بالمشكلة.
2. أرسل تعريفات الدوال والواجهات المهمة فقط.
3. أضف وصفًا مختصرًا للبنية.
4. اطلب من النموذج تعديلًا محددًا.

الاستدلال ووضع التفكير الموسع

Qwen3.7-Max-Preview هو نموذج استدلال. هذا يعني أنه مناسب أكثر للمهام التي تحتاج إلى تخطيط وتحقق، وليس فقط توليد نص سريع.

استخدمه عندما تكون المهمة مثل:

حل مشكلة برمجية متعددة الخطوات.
تحليل سبب خطأ معقد.
تصميم خوارزمية.
كتابة اختبار شامل لتدفق API.
تخطيط تنفيذ ميزة عبر عدة ملفات.
تشغيل وكيل يستخدم أدوات متعددة.

ولا تستخدم وضع التفكير الموسع عندما تكون المهمة بسيطة مثل:

تصنيف نص قصير.
إعادة صياغة جملة.
استخراج قيمة واحدة من JSON.
توليد عنوان أو وصف قصير.

في تقييم Artificial Analysis، أنتج Qwen3.7-Max حوالي 97 مليون رمز أثناء الاختبار، مقارنة بمتوسط يقارب 24 مليون رمز للنماذج في نفس المعيار. هذا يوضح أن نماذج الاستدلال قد تكون أكثر تكلفة وأبطأ لأنها تولد تفكيرًا داخليًا أو خطوات وسيطة أطول.

كيف تختبر مخرجات نموذج استدلال؟

لا تختبر الصياغة الحرفية دائمًا. مخرجات الاستدلال قد تختلف بين تشغيل وآخر. بدلًا من ذلك، اختبر:

وجود الإجابة النهائية.
صحة البنية.
التزام النموذج بالمخطط المطلوب.
عدم وجود حقول إضافية.
قابلية JSON للقراءة.
تحقق القيم المهمة.

مثال assert عملي لاستجابة JSON:

{
  "action": "create_ticket",
  "priority": "high",
  "summary": "Database timeout during checkout",
  "requires_human_review": true
}

يمكنك اختبارها بمنطق مثل:

const response = pm.response.json();

pm.test("action is create_ticket", function () {
  pm.expect(response.action).to.eql("create_ticket");
});

pm.test("priority is valid", function () {
  pm.expect(["low", "medium", "high"]).to.include(response.priority);
});

pm.test("summary exists", function () {
  pm.expect(response.summary).to.be.a("string").and.not.empty;
});

pm.test("requires_human_review is boolean", function () {
  pm.expect(response.requires_human_review).to.be.a("boolean");
});

لإعداد عملي أكثر حول استدعاءات النموذج وفحصها، راجع دليل كيفية استخدام واجهة برمجة تطبيقات Qwen 3.7.

معايير Qwen 3.7: كيف تقرأها؟

أرقام المعايير مفيدة، لكنها ليست بديلًا عن اختبار النموذج داخل تطبيقك. بالنسبة لنموذج جديد وفي مرحلة Preview، يجب الانتباه إلى أن النتائج قد تتغير قبل الإصدار المستقر.

مؤشر Artificial Analysis Intelligence Index

سجّل Qwen3.7-Max 57 نقطة في مؤشر Artificial Analysis Intelligence Index. وقد أُبلغ أن هذه النتيجة وضعته في المركز الأول ضمن تلك اللوحة العامة عند الإطلاق، متقدمًا على Qwen 3.6 Max Preview الذي سجّل 52 نقطة.

هذا رقم قوي، لكنه رقم مركب. لا يعني تلقائيًا أن النموذج هو الأفضل لكل حالة استخدام. اختبره على بياناتك أنت، خصوصًا إذا كانت حالتك تتضمن:

كود إنتاج.
مدخلات عربية أو متعددة اللغات.
مستندات داخلية.
قيود امتثال.
تكامل أدوات حقيقي.

تصنيف LM Arena النصي

في LM Arena، حصل Qwen3.7-Max-Preview على تصنيف يقارب 1,475 Elo، ما يضعه تقريبًا حول المرتبة #13 في اللوحة النصية العامة، مع أداء أعلى في فئات مثل الرياضيات والبرمجة.

الفرق المهم:

Artificial Analysis يقيس أداءً على مهام معيارية.
LM Arena يقيس تفضيلات بشرية بين إجابات مجهولة.

لذلك قد يتصدر نموذج معيارًا معينًا، بينما لا يكون الأعلى في تفضيلات المستخدمين.

ادعاءات الوكلاء والمهام الطويلة

تقول Alibaba إن Qwen3.7-Max قادر على الحفاظ على تنفيذ مهام مستقلة حتى 35 ساعة، والتعامل مع أكثر من 1000 استدعاء أداة في تشغيل واحد دون تدهور الأداء. هذه ادعاءات من الطرف الأول، ويجب التعامل معها كإشارات إلى الهدف التصميمي للنموذج حتى تعيد جهات مستقلة إنتاجها.

بالنسبة لك كمطور، اختبر ذلك عمليًا عبر سيناريوهات صغيرة أولًا:

1. اطلب من النموذج وضع خطة.
2. اجعله يستدعي أداة واحدة.
3. تحقق من المخرجات.
4. أضف أداة ثانية.
5. راقب الأخطاء والتكرار والتكلفة.
6. لا تنتقل إلى وكيل طويل إلا بعد نجاح الاختبارات القصيرة.

مقارنة Qwen 3.7 مع GPT-5.5 و Claude Opus 4.7 و Gemini 3.5

المواصفات	Qwen3.7-Max-Preview	GPT-5.5	Claude Opus 4.7	Gemini 3.5
المورد	Alibaba / Qwen	OpenAI	Anthropic	Google DeepMind
النوع	نموذج استدلال	نموذج استدلال	نموذج استدلال	نموذج استدلال
نافذة السياق	1 مليون رمز	~1 مليون رمز	~1 مليون رمز، وفق نطاقات مُبلغ عنها	~1 مليون+ رمز
الأوزان	خاصة	خاصة	خاصة	خاصة
مؤشر Artificial Analysis	57، مُبلغ أنه #1	غير مذكور هنا	غير مذكور هنا	غير مذكور هنا
مرحلة الإصدار	Preview	مستقر	مستقر	مستقر
وضع التفكير	نعم	نعم	نعم	نعم
القوة الرئيسية	مهام الوكيل طويلة الأمد	الوكلاء واستخدام الأدوات	كود بجودة إنتاجية	السياق الطويل وكفاءة التكلفة

القراءة العملية للمقارنة:

إذا كنت تريد نموذجًا مستقرًا ومتاحًا عالميًا، قد تكون النماذج الغربية الرائدة أسهل حاليًا.
إذا كنت تختبر وكلاء طويلين أو سير عمل يعتمد على أدوات كثيرة، يستحق Qwen 3.7 التجربة.
إذا كانت الأولوية هي الاستضافة الذاتية، Qwen 3.7 ليس مناسبًا بعد لأن الأوزان غير متاحة.
إذا كان القرار مبنيًا على التكلفة، انتظر تفاصيل التسعير الفعلية في Alibaba Cloud وقارنها على حجم طلباتك الحقيقي.

للمقارنة التفصيلية عند استقرار الأرقام، راجع Qwen 3.7 مقابل GPT-5.5 مقابل Opus 4.7. وإذا كانت قائمتك تتضمن نماذج Google، فراجع ما هو Gemini 3.5 وGemini 3.5 مقابل GPT-5.5 مقابل Opus 4.7. ولمتابعة النماذج الصينية المنافسة، راجع ما هو ERNIE 5.1.

كيفية الوصول إلى Qwen 3.7 اليوم

حتى منتصف مايو 2026، لديك ثلاث طرق للتعامل مع Qwen 3.7 أو مراقبته.

1. تجربة Qwen Chat

أسرع طريقة هي استخدام الواجهة الرسمية على chat.qwen.ai.

استخدمها أولًا من أجل:

اختبار جودة الإجابات.
تجربة وضع التفكير.
تقييم العربية أو لغتك المستهدفة.
تجربة مهام برمجية صغيرة.
تقدير مدى ملاءمة النموذج قبل كتابة أي تكامل.

2. استخدام Alibaba Cloud API

بدأ Qwen3.7-Max بالوصول إلى منصة API الخاصة بـ Alibaba في 19 مايو 2026، مع إطلاق تدريجي. تحقق دائمًا من وثائق Alibaba Cloud لمعرفة:

اسم النموذج النهائي.
endpoint المتاح.
آلية المصادقة.
حدود الاستخدام.
التسعير.
توفر المنطقة الجغرافية.

نمط التكامل سيكون عادةً قريبًا من هذا الشكل المفاهيمي:

curl -X POST "https://api-provider.example.com/v1/chat/completions" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.7-max-preview",
    "messages": [
      {
        "role": "system",
        "content": "أنت مساعد برمجي دقيق. أجب بإيجاز وبصيغة JSON عند الطلب."
      },
      {
        "role": "user",
        "content": "حلل هذا الخطأ واقترح إصلاحًا."
      }
    ]
  }'

ملاحظة: تحقق من endpoint واسم النموذج من وثائق Alibaba Cloud، لأن إصدار Preview قد تتغير تفاصيله.

لخطوات أكثر تحديدًا حول التكامل، راجع كيفية استخدام واجهة برمجة تطبيقات Qwen 3.7.

3. انتظار الأوزان المفتوحة

إذا كنت تريد self-hosting، فلا توجد أوزان Qwen 3.7 مفتوحة حتى منتصف مايو 2026. قد تتبع Alibaba نمطها السابق وتفتح إصدارات أصغر لاحقًا، لكن هذا غير مؤكد.

حتى ذلك الحين، كل استخدام عملي لـ Qwen 3.7 يمر عبر خدمة مستضافة. يتم تتبع خيارات الاستخدام المجاني أو منخفض التكلفة في دليل استخدام Qwen 3.7 مجانًا.

إعداد اختبار API عملي لـ Qwen 3.7

قبل إدخال النموذج إلى الإنتاج، أنشئ مجموعة اختبارات بسيطة:

طلب أساسي: prompt قصير للتأكد من المصادقة والاتصال.
طلب JSON: اجعل النموذج يعيد مخرجات منظمة.
طلب كود: اختبر مهمة برمجية صغيرة.
طلب سياق طويل: أرسل مستندًا أطول وقِس الاستجابة.
اختبار فشل: أرسل مدخلًا ناقصًا وتحقق من أن النموذج لا يخترع.
اختبار تكلفة: راقب عدد الرموز لكل نوع مهمة.

مثال prompt لإجبار المخرجات المنظمة:

أعد النتيجة بصيغة JSON فقط، دون Markdown.

المخطط:
{
  "bug_type": "string",
  "root_cause": "string",
  "fix_steps": ["string"],
  "risk_level": "low | medium | high"
}

الخطأ:
Timeout while connecting to database after deployment.

ثم اختبر أن الاستجابة قابلة للقراءة آليًا قبل تمريرها لتطبيقك.

هنا يمكن استخدام Apidog لتصميم الطلب، حفظ المتغيرات، محاكاة الاستجابات، وتشغيل اختبارات تلقائية على endpoint المباشر. يمكنك أيضًا تنزيل Apidog وإعداد مجموعة طلبات Qwen 3.7 خلال دقائق.

متى تستخدم Qwen 3.7؟

استخدم Qwen3.7-Max-Preview إذا كانت حالتك تتطلب:

سياقًا طويلًا جدًا.
استدلالًا متعدد الخطوات.
مهام وكيل تعتمد على أدوات.
تحليل كود أو مستندات كبيرة.
تجربة نموذج جديد قوي من Alibaba.

تجنّبه أو أجّل اعتماده إذا كنت تحتاج إلى:

إصدار مستقر بالكامل.
أوزان مفتوحة أو تشغيل محلي.
توفر عالمي مضمون.
تكلفة متوقعة وثابتة.
زمن استجابة منخفض لمهام بسيطة.

الخاتمة

Qwen 3.7، وتحديدًا Qwen3.7-Max-Preview، هو دخول قوي من Alibaba إلى سباق نماذج الاستدلال والوكلاء. أهم ما يميزه هو نافذة السياق الكبيرة، التركيز على المهام الطويلة، والنتائج القوية في بعض المعايير المبكرة.

لكن القرار العملي لا يجب أن يعتمد على لوحة متصدرين فقط. اختبره داخل سير عملك:

هل يلتزم بالمخرجات المطلوبة؟
هل يتعامل جيدًا مع بياناتك؟
هل التكلفة مقبولة؟
هل latency مناسب؟
هل يعمل التكامل بثبات؟
هل تحتاج فعلًا إلى مليون رمز؟

إذا وصل Qwen 3.7 إلى قائمتك المختصرة، فالخطوة التالية هي بناء تكامل API قابل للاختبار. يتيح لك Apidog تصميم الطلبات، محاكاة استجابات النموذج، تشغيل الاختبارات الآلية، وفحص كل استدعاء قبل شحن الميزة.