GLM-5.2 هو أحدث نموذج رائد من Z.ai (مختبر Zhipu AI): أوزان مفتوحة، موجه للبرمجة أولًا، ومصمم لمهام الاستدلال واستخدام الأدوات كوكيل. إذا كنت تريد فهمًا عمليًا لما يمكن فعله به، فهذا الدليل يشرح ما هو النموذج، كيف تصل إليه، كيف تستدعيه عبر API، ومتى تختار التفكير العالي أو الأقصى.
الخلاصة العملية
- ما هو: نموذج لغوي كبير مفتوح الأوزان من Z.ai للبرمجة، الاستدلال، واستخدام الأدوات.
- البنية: حوالي 753 مليار معلمة بنمط MoE، مع BF16 وميزة IndexShare للانتباه المتفرق.
- السياق: مليون رمز، أي 1,048,576 token.
- الإخراج: موثق حتى 128 ألف token في وثائق z.ai، لكن تحقق من الحد لدى المزود الذي تستخدمه.
- الترخيص: MIT، أي يمكنك تنزيل الأوزان، استضافتها ذاتيًا، تعديلها، واستخدامها تجاريًا.
- الوصول: API من Z.ai، Claude Code عبر GLM Coding Plan، OpenRouter، وOllama.
- القيود: النموذج نص-إلى-نص فقط. لا يوجد إصدار رؤية مؤكد، لذلك لا تعتمد عليه لمعالجة الصور.
من يصنع GLM-5.2؟
GLM-5.2 يأتي من Z.ai، المعروف أيضًا باسم Zhipu AI. هو امتداد لعائلة GLM بعد GLM-5.1، لكنه يركز بشكل أوضح على البرمجة، حل مشكلات المستودعات، وتشغيل الأدوات ضمن تدفقات عمل توكيلية.
الفكرة المهمة للمطورين: GLM-5.2 ليس نموذجًا مغلقًا خلف API فقط. أوزانه متاحة، وترخيصه يسمح لك بتشغيله داخل بنيتك الخاصة إذا كان لديك العتاد المناسب. إذا كنت قد قرأت نظرتنا العامة عن GLM-5.1، فاعتبر GLM-5.2 إصدارًا أكثر تركيزًا على البرمجة والعمل طويل الأفق.
معرفات النموذج حسب المنصة
عند دمج النموذج، انتبه إلى أن اسم النموذج يختلف حسب المزود:
| المنصة | معرف النموذج |
|---|---|
| Hugging Face | zai-org/GLM-5.2 |
| API من Z.ai | glm-5.2 |
| Ollama | glm-5.2 |
| OpenRouter | z-ai/glm-5.2 |
يمكنك مراجعة الأوزان والملفات من صفحة GLM-5.2 على Hugging Face.
البنية باختصار: 753B MoE + IndexShare
GLM-5.2 يستخدم تصميم Mixture of Experts - MoE بحوالي 753 مليار معلمة. في MoE لا يتم تفعيل كل المعلمات لكل token؛ بدلًا من ذلك يتم توجيه كل token إلى مجموعة خبراء محددة. النتيجة: سعة نموذج ضخمة مع تكلفة تشغيل أقل من نموذج كثيف بالحجم نفسه.
الميزة الأحدث هي IndexShare، وهي طريقة من Z.ai لتقليل تكلفة الانتباه المتفرق في السياقات الطويلة. بدلًا من حساب مفهرس جديد لكل طبقة انتباه، يعاد استخدام مفهرس واحد عبر كل 4 طبقات انتباه متفرق.
كمطور، ما يهمك هو التالي:
- يمكنك تمرير سياقات كبيرة جدًا مثل مواصفات طويلة أو أجزاء كبيرة من مستودع.
- تكلفة وزمن الاستجابة لا يرتفعان بنفس حدة الانتباه الكامل التقليدي.
- هذا مفيد خصوصًا لتطبيقات مراجعة الكود، تحليل المستودعات، أو الوكلاء الذين يحتاجون ذاكرة سياقية طويلة.
نافذة سياق بحجم مليون token
يدعم GLM-5.2 سياقًا بحجم 1,048,576 token. هذا يسمح بسيناريوهات مثل:
- تحليل مستودع متوسط الحجم.
- تمرير مستندات مواصفات طويلة.
- بناء وكيل يقرأ سجلات، ملفات إعداد، ووثائق API في طلب واحد.
- تشغيل مهام refactoring أو migration تحتاج رؤية واسعة للكود.
لكن لا تفترض أن كل مزود يعطيك نفس حدود الإخراج. وثائق z.ai تذكر إخراجًا حتى 128 ألف token، بينما قد تختلف الحدود في OpenRouter أو غيره. إذا كان تطبيقك يعتمد على مخرجات طويلة جدًا، اختبر الحد فعليًا قبل البناء عليه.
للمقارنة بين الإصدارين، راجع مقارنة GLM-5.2 و GLM-5.1.
التحكم في التفكير: High و Max و Disabled
GLM-5.2 يدعم سلوك استدلال قابل للتحكم. عمليًا لديك ثلاثة أنماط استخدام:
| الوضع | متى تستخدمه |
|---|---|
disabled |
مهام بسيطة: تلخيص، تحويل صيغة، استخراج JSON، إعادة تنسيق |
high |
أسئلة برمجية متوسطة، debugging، تفسير كود |
max |
refactoring كبير، حل مشكلات مستودع، مهام agentic coding طويلة |
مثال API باستخدام التفكير الأقصى:
curl https://api.z.ai/api/paas/v4/chat/completions \
-H "Authorization: Bearer $ZAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.2",
"messages": [
{
"role": "user",
"content": "راجع هذا التصميم واقترح خطة refactor تدريجية."
}
],
"thinking": {"type": "enabled"},
"reasoning_effort": "max",
"stream": true
}'
قاعدة عملية:
- استخدم
maxعندما تكون تكلفة الخطأ عالية. - استخدم
highللمهام اليومية. - استخدم
disabledللطلبات الرخيصة والسريعة.
لشكل الطلب الكامل، راجع دليل GLM-5.2 API.
ماذا يعني ترخيص MIT للمطورين؟
ترخيص MIT يجعل GLM-5.2 مناسبًا لفرق تحتاج تحكمًا أكبر من API مغلق:
- استضافة ذاتية: تشغيل النموذج داخل بيئتك أو على GPU مستأجرة.
- Fine-tuning: تكييف النموذج مع مجال عملك أو أسلوب الكود الداخلي.
- استخدام تجاري: بناء منتجات فوقه دون ترخيص مقيد.
- تحكم في البيانات: مناسب لسيناريوهات الإقامة المحلية للبيانات أو الامتثال.
إذا أردت مسارًا محليًا، راجع تشغيل GLM-5 محليًا مجانًا وGLM-5 مجانًا مع Ollama. الأنماط نفسها تنطبق على GLM-5.2 مع مراعاة متطلبات العتاد الأكبر.
المعايير: أين يتفوق GLM-5.2؟
الأرقام التالية منشورة من Z.ai، لذلك تعامل معها كقياسات من البائع لا كاختبار مستقل:
| المعيار | GLM-5.2 | مقارنة بارزة |
|---|---|---|
| Terminal-Bench 2.1 | 81.0 | GLM-5.1 سجل 62.0 |
| SWE-bench Pro | 62.1 | GPT-5.5 سجل 58.6، وGLM-5.1 سجل 58.4 |
| MCP-Atlas | 77.0 | GPT-5.5 سجل 75.3، وClaude Opus 4.8 سجل 77.8 |
| Humanity’s Last Exam مع الأدوات | 54.7 | GPT-5.5 سجل 52.2 |
| AIME 2026 | 99.2 | غير متوفر |
| GPQA-Diamond | 91.2 | غير متوفر |
أهم رقم للمطورين هو Terminal-Bench 2.1، لأنه يقيس قدرة النموذج على تنفيذ مهام عبر الطرفية، لا مجرد إنتاج مقتطفات كود. القفزة من 62.0 إلى 81.0 تشير إلى تحسن واضح في العمل التوكيلي.
كما ذكرت VentureBeat أن GLM-5.2 "يتفوق على GPT-5.5 في البرمجة طويلة الأفق بتكلفة حوالي سدس التكلفة" في تغطيتها لـ GLM-5.2. هذه صياغة VentureBeat وليست قياسًا من Apidog.
للتفاصيل، راجع الغوص العميق في معايير GLM-5.2 ومقارنة GLM-5.2 مع GPT-5.5 و Claude Opus و Gemini.
طرق الوصول إلى GLM-5.2
| المسار | الأفضل لـ | ملاحظة |
|---|---|---|
| API من Z.ai | تطبيقات production واستدعاءات مباشرة | متوافق مع OpenAI |
| Claude Code عبر GLM Coding Plan | البرمجة التوكيلية من الطرفية | استخدم متغير [1m] للسياق الطويل |
| OpenRouter | استخدام مفتاح واحد لعدة نماذج | المعرف z-ai/glm-5.2
|
| Ollama | تشغيل محلي أو غير متصل | يحتاج عتادًا قويًا |
1. استخدام API من Z.ai
نقطة النهاية:
https://api.z.ai/api/paas/v4/chat/completions
مثال طلب بسيط:
export ZAI_API_KEY="your-api-key"
curl https://api.z.ai/api/paas/v4/chat/completions \
-H "Authorization: Bearer $ZAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.2",
"messages": [
{
"role": "system",
"content": "أنت مساعد برمجي مختصر ودقيق."
},
{
"role": "user",
"content": "اكتب دالة JavaScript تتحقق من صحة بريد إلكتروني وتعيد boolean."
}
],
"thinking": {"type": "enabled"},
"reasoning_effort": "high",
"temperature": 0.2,
"stream": false
}'
للبرمجة، اجعل temperature منخفضة نسبيًا لتقليل العشوائية.
2. استخدام GLM-5.2 مع Claude Code
تقدم Z.ai نقطة نهاية متوافقة مع Anthropic لاستخدام GLM-5.2 داخل Claude Code.
export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
ملاحظات مهمة:
- اللاحقة
[1m]تحدد متغير السياق بحجم مليون token. - ارفع
API_TIMEOUT_MSلأن مهام السياق الطويل قد تتجاوز المهلة الافتراضية. - تحقق من عنوان الـ base URL الحالي من الوثائق الرسمية، لأن بعض المصادر تعرض
open.z.ai/api/paas/v4.
دليل الإعداد الكامل مع Claude Code وCline وCursor موجود هنا: دليل GLM-5.2 في Claude Code و Cline و Cursor. وللجيل السابق: GLM-5.1 مع Claude Code.
3. استخدام OpenRouter
إذا كنت تستخدم OpenRouter، استدع النموذج بالمعرف:
z-ai/glm-5.2
الصفحة المباشرة: openrouter.ai/z-ai/glm-5.2.
لا تعتمد على وجود مستوى مجاني لهذا النموذج في OpenRouter.
4. استخدام Ollama
للتشغيل المحلي، راجع مكتبة Ollama واسحب النموذج:
ollama pull glm-5.2
ثم:
ollama run glm-5.2
هذا المسار مناسب عندما تريد التحكم في البيانات أو العمل دون اتصال، لكن تذكر أن نموذج MoE بحجم 753B يحتاج موارد GPU كبيرة لتشغيل مريح.
لخيارات الاستخدام المجاني، راجع كيفية استخدام GLM-5.2 مجانًا.
مثال عملي: وكيل يستدعي أدواتك
إذا كنت تبني وكيلًا يستخدم GLM-5.2 لاستدعاء API داخلي، صمم الأدوات كعقود واضحة. مثال مبسط لأداة بحث في issues:
{
"name": "search_issues",
"description": "البحث في مشكلات GitHub الداخلية حسب الكلمات المفتاحية والحالة.",
"parameters": {
"type": "object",
"properties": {
"query": {
"type": "string",
"description": "كلمات البحث"
},
"status": {
"type": "string",
"enum": ["open", "closed", "all"]
},
"limit": {
"type": "integer",
"minimum": 1,
"maximum": 50
}
},
"required": ["query"]
}
}
ثم اطلب من النموذج استخدام الأداة بدل التخمين:
ابحث عن المشكلات المفتوحة المتعلقة بـ memory leak في خدمة billing، ثم اقترح خطة تحقيق من 5 خطوات. استخدم أداة search_issues أولًا.
نصيحة تنفيذية: وثّق كل أداة بوضوح، وحدد الأنواع والقيود، واختبر حالات الفشل مثل نتائج فارغة، timeout، أو استجابة غير صالحة.
التسعير باختصار
على OpenRouter، التسعير المؤكد هو:
- 1.40 دولار لكل مليون token إدخال
- 4.40 دولار لكل مليون token إخراج
تذكر VentureBeat أن الإدخال المخزن مؤقتًا يقارب 0.26 دولار لكل مليون token. أما GLM Coding Plan فلديه اشتراكات متدرجة مثل Lite وPro وMax وTeam، لكن الأسعار الشهرية الدقيقة قد تختلف حسب المصدر والزمن، لذلك تحقق من z.ai قبل الالتزام.
راجع أيضًا تفصيل أسعار GLM-5.2.
أين تتناسب Apidog؟
إذا كنت تبني تطبيقًا يستدعي GLM-5.2 أو وكيلًا يستخدم أدواتك الداخلية، ستحتاج إلى تصميم واختبار وتوثيق APIs بوضوح. هنا تساعد Apidog في:
- تصميم endpoints قبل تنفيذها.
- محاكاة APIs التي سيستدعيها الوكيل.
- اختبار request/response payloads.
- تصحيح streaming واستدعاءات الأدوات.
- إبقاء الوثائق متزامنة مع العقد الفعلي.
عندما تكون جاهزًا للتجربة، يمكنك تنزيل Apidog واستخدامه لاختبار تكامل GLM-5.2.
مقارنات مفيدة
إذا كنت تقارن GLM-5.2 مع نماذج أخرى، ابدأ بهذه الروابط:
- GLM-5.1 مقابل Claude، GPT، Gemini، و DeepSeek
- GLM-5 مقابل DeepSeek مقابل GPT-5 من حيث السرعة والتكلفة
- Claude Opus 4.8 مقابل GPT-5.5 مقابل Gemini 3.5
- منشور Z.ai الرسمي عن GLM-5.2
- وثائق GLM-5.2 الرسمية
الأسئلة الشائعة
ما هو GLM-5.2 في جملة واحدة؟
GLM-5.2 هو نموذج لغوي كبير مفتوح الأوزان من Z.ai، مبني بتصميم MoE بحوالي 753 مليار معلمة، وموجه للبرمجة والاستدلال واستخدام الأدوات، مع سياق بحجم مليون token وترخيص MIT.
هل GLM-5.2 مجاني؟
الأوزان مجانية للتنزيل والاستضافة الذاتية بموجب MIT. لكن API المستضاف، GLM Coding Plan، وبعض المزودين مثل OpenRouter مدفوعة. لذلك "مجاني" هنا تعني أوزان مفتوحة، لا بالضرورة endpoint مجاني.
هل يدعم الصور؟
لا. GLM-5.2 نص-إلى-نص وفق وثائق API، ولا يوجد إصدار رؤية مؤكد. استخدم نموذج رؤية منفصل إذا كنت تحتاج إدخال صور.
ما الفرق الأهم بين GLM-5.2 و GLM-5.1؟
الفرق الأوضح هو تحسن البرمجة التوكيلية. وفق نتائج Z.ai، ارتفع Terminal-Bench 2.1 من 62.0 إلى 81.0، مع تحسينات في SWE-bench Pro وإضافة IndexShare للانتباه المتفرق. للمزيد: GLM-5.2 مقابل GLM-5.1.
ما طول السياق والإخراج؟
السياق مليون token. الإخراج موثق حتى 128 ألف token حسب z.ai، لكن تحقق من الحد الفعلي لدى المزود الذي تستخدمه.
الخلاصة
GLM-5.2 نموذج برمجة جاد مفتوح الأوزان: 753B MoE، سياق مليون token، ترخيص MIT، وتحكم في جهد الاستدلال. استخدمه عبر API للتكامل السريع، عبر Claude Code للبرمجة التوكيلية، عبر OpenRouter لتوحيد المزودين، أو محليًا عبر Ollama إذا كانت لديك موارد كافية. فقط تذكر حدوده: نص فقط، حدود إخراج تختلف حسب المزود، ومعايير منشورة من البائع. عندما تبدأ التنفيذ، ابدأ من دليل GLM-5.2 API.


Top comments (0)