MiniMax M3 هو نموذج للاستدلال والبرمجة مع نافذة سياق تصل إلى 1,000,000 رمز. عمليًا، يمكنك تمرير مستودع كبير، سجلات طويلة، أو وثيقة تصميم كاملة وطلب تحليلها في استدعاء واحد. إذا كنت تريد خلفية سريعة عن النموذج وموقعه، ابدأ من ما هو MiniMax M3.
هذا الدليل يركز على التنفيذ: إنشاء مفتاح API، إرسال أول طلب عبر curl و Python و Node.js، ثم اختبار الطلب يدويًا في Apidog قبل إدخاله في تطبيقك. يمكنك أيضًا تنزيل Apidog للمتابعة خطوة بخطوة.
المرجع الرسمي موجود في وثائق API الخاصة بـ MiniMax. أبقه مفتوحًا أثناء التنفيذ.
ما ستحتاجه
قبل البدء، جهّز التالي:
- حساب MiniMax على platform.minimax.io.
- مفتاح API.
- طريقة فوترة: أرصدة دفع حسب الاستخدام أو خطة اشتراك للرموز.
- لأمثلة SDK:
- Python 3.8+
- Node.js 18+
أمثلة curl لا تحتاج إلى أي تثبيت إضافي.
الخطوة 1: إنشاء مفتاح API
سجّل الدخول إلى platform.minimax.io، ثم افتح قسم مفاتيح API وأنشئ مفتاحًا جديدًا.
يوجد نوعان من بيانات الاعتماد:
- مفتاح API عادي: تتم فوترته من رصيد الدفع حسب الاستخدام.
- مفتاح اشتراك: يستخدم أرصدة الرموز من خطة Plus أو Max أو Ultra. عند نفاد رموز الخطة، تتوقف الطلبات على هذا المفتاح حتى التجديد أو التحويل إلى مفتاح دفع حسب الاستخدام.
بعد إنشاء المفتاح، انسخه واحفظه في مدير أسرار أو متغير بيئة. لا تضعه داخل الشيفرة المصدرية.
export MINIMAX_API_KEY="your-key-here"
بهذه الطريقة لا يتسرب المفتاح إلى Git أو إلى ملفات مشتركة. إذا كنت تستخدم مفاتيح API داخل محرر مثل VS Code، راجع أيضًا أمان مفتاح API لإضافات VS Code.
الخطوة 2: إرسال أول طلب إلى MiniMax M3
عنوان API الأساسي هو:
https://api.minimax.io/v1
ونقطة نهاية المحادثة هي:
POST https://api.minimax.io/v1/chat/completions
المصادقة تتم عبر Bearer Token:
Authorization: Bearer $MINIMAX_API_KEY
واسم النموذج هو:
MiniMax-M3
مثال curl
ابدأ بأبسط طلب عملي:
curl https://api.minimax.io/v1/chat/completions \
-H "Authorization: Bearer $MINIMAX_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "MiniMax-M3",
"messages": [
{
"role": "user",
"content": "Refactor this function to be async."
}
]
}'
إذا عاد الرد بنجاح، فأنت جاهز للانتقال إلى SDK.
استخدام OpenAI SDK مع MiniMax M3
MiniMax يدعم نمطًا متوافقًا مع OpenAI SDK. التغيير الأساسي هو base_url.
Python
from openai import OpenAI
import os
client = OpenAI(
base_url="https://api.minimax.io/v1",
api_key=os.environ["MINIMAX_API_KEY"],
)
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{
"role": "user",
"content": "Refactor this function to be async."
}
],
)
print(response.choices[0].message.content)
Node.js
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://api.minimax.io/v1",
apiKey: process.env.MINIMAX_API_KEY,
});
const response = await client.chat.completions.create({
model: "MiniMax-M3",
messages: [
{
role: "user",
content: "Refactor this function to be async.",
},
],
});
console.log(response.choices[0].message.content);
إذا كنت استخدمت سابقًا Qwen 3.7 API، فالنمط مشابه: غيّر base_url واسم النموذج فقط. للمزيد حول العملاء، راجع OpenAI Python SDK و Anthropic SDK.
الخطوة 3: اختبار الطلب في Apidog قبل ربطه بالتطبيق
قبل كتابة منطق التكامل داخل تطبيقك، اختبر الطلب يدويًا وتحقق من الاستجابة الخام. هذا يقلل أخطاء المصادقة، تنسيق JSON، واختلافات المخطط.
اتبع الخطوات التالية في Apidog:
- أنشئ طلب HTTP جديدًا.
- اضبط الطريقة على
POST. - استخدم الرابط:
https://api.minimax.io/v1/chat/completions
- افتح لوحة البيئات وأضف متغيرًا باسم:
MINIMAX_API_KEY
- ضع مفتاحك كقيمة للمتغير.
- أضف الهيدر التالي:
Authorization: Bearer {{MINIMAX_API_KEY}}
- أضف هيدر نوع المحتوى:
Content-Type: application/json
- اجعل الجسم
raw JSONوالصق:
{
"model": "MiniMax-M3",
"messages": [
{
"role": "user",
"content": "Refactor this function to be async."
}
]
}
- اضغط Send وافحص الاستجابة.
[لقطة شاشة: طلب واستجابة MiniMax-M3 في Apidog]
تخزين المفتاح كمتغير بيئة يتيح لك مشاركة الطلب مع الفريق بدون تسريب السر. كما يمكنك تبديل مفتاح الدفع حسب الاستخدام ومفتاح الاشتراك بتغيير قيمة واحدة فقط.
إذا استخدمت البث لاحقًا، يساعدك Apidog على رؤية Server-Sent Events كما تصل، قبل أن تكتب كود التحليل داخل التطبيق.
الخطوة 4: تشغيل وإيقاف reasoning_split
MiniMax M3 نموذج استدلالي. افتراضيًا، يعيد الإجابة النهائية. يمكنك أيضًا طلب فصل الاستدلال الوسيط عبر reasoning_split.
استخدم هذا عندما تحتاج إلى تصحيح سبب وصول النموذج إلى نتيجة معينة أو مراجعة خطواته.
Python مع reasoning_split
from openai import OpenAI
import os
client = OpenAI(
base_url="https://api.minimax.io/v1",
api_key=os.environ["MINIMAX_API_KEY"],
)
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{
"role": "user",
"content": "Refactor this function to be async."
}
],
extra_body={
"reasoning_split": True
},
)
thinking = response.choices[0].message.reasoning_details[0]["text"]
answer = response.choices[0].message.content
print("Reasoning:")
print(thinking)
print("Final answer:")
print(answer)
عند تفعيل reasoning_split:
- الاستدلال يعود في:
response.choices[0].message.reasoning_details[0]["text"]
- الإجابة النهائية تبقى في:
response.choices[0].message.content
استخدمه في الحالات الصعبة مثل:
- إعادة هيكلة متعددة الخطوات.
- تحليل أخطاء معقدة.
- مراجعة قرارات النموذج.
وأوقفه في الطلبات البسيطة أو الحساسة للتأخير، لأن رموز التفكير الإضافية تزيد الوقت والتكلفة.
الخطوة 5: استخدام نافذة سياق 1 مليون رمز
الميزة الأبرز في M3 هي نافذة السياق الكبيرة. يمكنك تمرير ملف طويل، مثل سجل إنتاج، ثم طرح سؤال واحد على كامل المحتوى.
مثال:
from openai import OpenAI
import os
client = OpenAI(
base_url="https://api.minimax.io/v1",
api_key=os.environ["MINIMAX_API_KEY"],
)
with open("production-2026-05-30.log") as f:
log_text = f.read()
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{
"role": "user",
"content": (
"Find the root cause of the 502 spike at 14:20 UTC.\n\n"
f"{log_text}"
),
}
],
)
print(response.choices[0].message.content)
لكن لا ترسل مليون رمز افتراضيًا. MiniMax يطبّق تسعيرًا قياسيًا للمدخلات حتى 512 ألف رمز، ثم يطبّق سعرًا أعلى للسياق الطويل بعد تجاوز هذه العتبة.
الخلاصة العملية:
- أرسل فقط الجزء اللازم من السياق.
- قصّ السجلات أو الملفات قبل الطلب عندما يكون ذلك ممكنًا.
- في الوكلاء، قلّل السياق في كل دورة لأن التكلفة تتراكم عبر الاستدعاءات.
للمزيد حول تقليل تكلفة الوكلاء، راجع كيفية تقليل تكاليف رموز الوكيل.
الخطوة 6: استدعاء الأدوات
يدعم M3 استدعاء الأدوات، ما يجعله مناسبًا لبناء وكلاء يمكنهم تنفيذ دوال، تشغيل اختبارات، أو استدعاء خدمات خارجية.
الفكرة العامة:
- تعرّف الأدوات المتاحة للنموذج.
- يقرر النموذج ما إذا كان يحتاج إلى أداة.
- يعيد
tool_calls. - ينفذ تطبيقك الأداة.
- ترسل نتيجة الأداة للنموذج في طلب جديد.
مثال أداة لتشغيل الاختبارات:
tools = [
{
"type": "function",
"function": {
"name": "run_tests",
"description": "Run the test suite for a given module path.",
"parameters": {
"type": "object",
"properties": {
"module": {
"type": "string"
},
},
"required": ["module"],
},
},
}
]
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{
"role": "user",
"content": "Fix the failing test in auth/session.py and confirm it passes."
}
],
tools=tools,
)
بعد الاستجابة، افحص:
tool_calls = response.choices[0].message.tool_calls
إذا وجدت استدعاء أداة، نفّذ الدالة محليًا، ثم أرسل النتيجة كرسالة tool في طلب لاحق.
هذه المصافحة هي مصدر شائع للأخطاء في الوكلاء. قبل الإنتاج، راجع ربط أدوات سير عمل الوكيل.
يمكنك أيضًا استخدام Apidog لتقسيم التبادل إلى طلبات محفوظة:
- الطلب الأولي.
- استجابة
tool_calls. - نتيجة الأداة.
- طلب المتابعة.
بهذا يمكنك اختبار كل قفزة بدون الاعتماد على وقت تشغيل الوكيل.
الخطوة 7: الإدخال متعدد الوسائط
يدعم M3 الإدخال متعدد الوسائط، بما في ذلك الصور. تمرر محتوى الصورة داخل مصفوفة الرسائل بجانب النص، وفق شكل أجزاء المحتوى القياسية.
بما أن أسماء الحقول وتنسيقات الوسائط قد تتغير أسرع من واجهات النص، تحقق دائمًا من مرجع API قبل الاعتماد على شكل ثابت في الإنتاج.
التسعير والطبقات
يوجد عاملان يؤثران على التكلفة والأداء:
1. خطة الرموز
خطط الاشتراك تشمل مستويات مثل:
- Plus بسعر 20 دولارًا.
- Max بسعر 50 دولارًا.
- Ultra بسعر 120 دولارًا.
كل خطة توفر رصيد رموز مختلفًا يتم استخدامه عبر مفتاح الاشتراك. أما مفتاح API العادي فيُخصم من رصيد الدفع حسب الاستخدام.
2. مستوى الخدمة
يوجد مستويان:
-
standard: الافتراضي ومناسب لمعظم الاستخدامات. -
priority: مناسب للطلبات الحساسة للتأخير أو المرتبطة باتفاقيات SLA.
تذكّر أيضًا عتبة 512 ألف رمز من الخطوة السابقة. التكلفة الفعلية تعتمد على:
- حجم الإدخال.
- حجم الإخراج.
- نوع الخطة.
- مستوى الخدمة.
- هل تجاوز الطلب عتبة السياق الطويل أم لا.
للأرقام الحالية، راجع صفحة MiniMax للتسعير والنموذج و وثائق API.
الأسئلة الشائعة
هل توجد طريقة مجانية لتجربة M3؟
نعم. يمكنك تجربة النموذج بدون الالتزام بخطة مدفوعة في بعض الحالات. راجع كيفية استخدام MiniMax M3 مجانًا.
ما حزم SDK التي تعمل مع API؟
يمكنك استخدام:
- HTTP الخام.
- Anthropic SDK.
- OpenAI SDK.
MiniMax يوصي بـ Anthropic SDK، لكن OpenAI SDK يعمل أيضًا عبر نفس نقطة النهاية:
https://api.minimax.io/v1/chat/completions
في عملاء OpenAI أو Anthropic، غيّر base_url فقط للإشارة إلى MiniMax.
كيف أبث الاستجابات؟
أضف:
{
"stream": true
}
إلى جسم الطلب. يعيد API أحداث Server-Sent Events، وتعرض حزم SDK مكررًا يمكنك المرور عليه لقراءة الأجزاء عند وصولها.
اختبر البث في Apidog أولًا لتعرف تنسيق الأحداث قبل كتابة كود التحليل.
ما حد المعدل؟
يعتمد حد المعدل على مستوى حسابك وعلى استخدامك لـ standard أو priority. إذا حصلت على 429، استخدم backoff وحاول مرة أخرى. للحركة الحساسة للتأخير، انقلها إلى مستوى الأولوية إذا كان مناسبًا.
كيف تؤثر عتبة 512 ألف رمز على الفاتورة؟
الطلبات التي تحتوي على 512 ألف رمز إدخال أو أقل تُفوتر بالسعر القياسي. بعد هذه العتبة، يطبق معدل السياق الطويل الأعلى. لذلك، لا ترسل سياقًا كبيرًا إلا عندما يحتاجه النموذج فعلًا.
هل يمكنني استضافة الأوزان بنفسي؟
هذا الدليل يغطي API المستضاف لأنه أسرع مسار للبدء. الاستضافة الذاتية تعتمد على ما تنشره MiniMax لـ M3 في ذلك الوقت، لذلك راجع صفحة النموذج لمعرفة حالة الأوزان والتراخيص.
الخلاصة
لديك الآن مسار عملي لاستدعاء MiniMax M3:
- إنشاء مفتاح API.
- تخزين المفتاح كمتغير بيئة.
- إرسال طلب عبر
curl. - استخدام OpenAI SDK في Python و Node.js.
- اختبار الطلب في Apidog.
- تفعيل
reasoning_splitعند الحاجة. - التعامل مع نافذة سياق 1 مليون رمز بحذر.
- فهم عتبة 512 ألف رمز.
- البدء في استدعاء الأدوات وبناء الوكلاء.
أسرع تحقق عملي: افتح Apidog، أنشئ طلب POST إلى نقطة النهاية، خزّن المفتاح كمتغير بيئة، أرسل موجهًا بسيطًا، وافحص الاستجابة الخام. بعد ذلك يصبح دمج MiniMax M3 داخل تطبيقك خطوة مباشرة.



Top comments (0)