حول DeepSeek الخصم المؤقت الأكثر قوة في تسعير نماذج اللغة الكبيرة (LLM) لعام 2026 إلى السعر الافتراضي الجديد. في 22 مايو، أعلن الفريق أن عرض DeepSeek-V4-Pro بخصم 75%، والذي كان من المقرر أن ينتهي في 31 مايو 2026 الساعة 15:59 بالتوقيت العالمي المنسق (UTC)، سيصبح دائمًا. ينخفض سعر الإدخال إلى 0.435 دولار لكل مليون رمز، والإخراج إلى 0.87 دولار، ومرات التخزين المؤقت (cache hits) إلى 0.003625 دولار. إذا كنت تشغّل ميزة تعتمد على API لنموذج LLM، فهذا الأسبوع مناسب لإعادة حساب التكلفة وإعادة اختبار المسارات الحرجة.
باختصار
- أصبح تسعير DeepSeek-V4-Pro API دائمًا بربع السعر الأصلي:
- الإدخال: 0.435 دولار/مليون رمز
- الإخراج: 0.87 دولار/مليون رمز
- إدخال مع cache hit: 0.003625 دولار/مليون رمز
- الخصم الترويجي بنسبة 75% الذي كان سينتهي في 31 مايو 2026 أصبح السعر العادي.
- V4-Pro أصبح أرخص بنحو 34 مرة من GPT-5.5 على الإخراج، مع أداء يقع ضمن حوالي 95% من GPT-5.5 في معظم معايير البرمجة والاستدلال المذكورة.
- قيمة cache-hit هي الجزء العملي الأهم: مطالبات النظام الطويلة وتعريفات الأدوات يمكن أن تصبح شبه مجانية عند تثبيت البادئة.
- إذا قمت بتسعير ميزات الذكاء الاصطناعي لديك على GPT-5.5 أو Claude Opus 4.7 في الربع الأخير، فأعد حساب الهامش الآن.
لماذا يهم هذا الآن
عادةً ينخفض تسعير LLM ببطء. ما فعله DeepSeek مختلف: عرض ترويجي قوي في مايو، ثم تثبيت السعر بدل العودة إلى القائمة القديمة. بالنسبة للمطور، هذا يعني أن تصميم المنتج نفسه قد يتغير، وليس الفاتورة فقط.
إذا كان منتجك يستدعي LLM في مسار حرج مثل:
- الإكمال التلقائي
- دردشة RAG
- مراجعة التعليمات البرمجية
- وكلاء الأدوات
- توليد المحتوى
- معالجة JSON structured output
فإن الفرق بين 3.48 دولار و0.87 دولار لكل مليون رمز إخراج سيظهر مباشرة في الفاتورة.
مثال سريع:
50 مليون رمز إخراج يوميًا
السعر القديم:
50 × 3.48 = 174 دولار/يوم
174 × 30 ≈ 5,220 دولار/شهر
السعر الجديد:
50 × 0.87 = 43.5 دولار/يوم
43.5 × 30 ≈ 1,305 دولار/شهر
الفرق الشهري يقارب 3,900 دولار لحمل واحد فقط.
إذا كنت تبني فوق DeepSeek، يتيح لك Apidog إنشاء واختبار ومراقبة استدعاءات API لـ V4-Pro في مساحة عمل واحدة، بما في ذلك التدفق، واستدعاءات الأدوات، والتحقق من مخطط JSON. يمكنك استنساخ الطلبات، تعديل عنوان URL الأساسي، وتشغيل اختبارات مقارنة قبل الإنتاج.
في هذا المنشور سنحوّل الخبر إلى خطوات تنفيذية:
- فهم الأسعار الجديدة.
- حساب تأثير cache hits.
- مقارنة V4-Pro مع النماذج الأخرى.
- اختبار نموذجك الحالي مقابل V4-Pro.
- تحديد متى تهاجر ومتى تستخدم routing مختلط.
ما الذي تغير: فك شفرة الإعلان
إشعار تسعير DeepSeek الرسمي قصير، لكنه يغير عدة أرقام مهمة.
1. الخصم بنسبة 75% أصبح دائمًا
كان العرض الترويجي سيستمر حتى 31 مايو 2026 الساعة 15:59 UTC. الآن السعر الترويجي هو سعر القائمة الجديد.
2. التخفيض ينطبق على V4-Pro
DeepSeek-V4-Flash كان رخيصًا بالفعل بسعر 0.14 دولار/مليون رمز إدخال و0.28 دولار/مليون رمز إخراج. التخفيض الرئيسي هنا يخص V4-Pro، نموذج الفئة الأعلى.
للمقارنة بين Flash وPro، راجع: ما هو DeepSeek V4.
3. تسعير cache-hit أصبح منخفضًا جدًا
تم تخفيض تسعير مرات التخزين المؤقت إلى 0.003625 دولار/مليون رمز. هذا مهم جدًا للوكلاء وتطبيقات RAG لأن البادئة الثابتة غالبًا تكون كبيرة:
- system prompt
- تعريفات الأدوات
- JSON schemas
- تعليمات التنسيق
- أمثلة few-shot
إذا بقيت هذه البادئة متطابقة بين الطلبات، يمكن أن تستفيد من cache hits وتخفض تكلفة الإدخال بشكل كبير.
ورقة الأسعار الدائمة الجديدة
التسعير لكل مليون رمز، بالدولار الأمريكي:
| نوع الرمز | القائمة القديمة | القائمة الدائمة الجديدة | التخفيض |
|---|---|---|---|
| الإدخال بدون تخزين مؤقت | $1.74 | $0.435 | 75% |
| الإدخال مع تخزين مؤقت | $0.0145 | $0.003625 | 75% |
| الإخراج | $3.48 | $0.87 | 75% |
ملاحظات تنفيذية:
- رموز الإخراج غالبًا هي الجزء الأغلى في الوكلاء، لأن النموذج يكتب خطوات، كود، JSON، أو تحليلات طويلة.
- نسبة تكلفة الإدخال بدون cache إلى الإدخال مع cache تقارب 120:1.
- أي تصميم prompt يثبت البادئة يمكن أن يخفض تكلفة الإدخال بشكل كبير.
- الأسعار تخص API. دردشة الويب الخاصة بـ DeepSeek تبقى مجانية للأفراد.
للسياق التاريخي حول مستويات تسعير V4، راجع: تسعير DeepSeek V4 API.
مثال استدعاء API قابل للاختبار
إذا كان لديك عميل متوافق مع OpenAI، يمكنك اختبار DeepSeek بتغيير base_url إلى:
https://api.deepseek.com
مثال curl مبسط:
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $DEEPSEEK_API_KEY" \
-d '{
"model": "deepseek-v4-pro",
"messages": [
{
"role": "system",
"content": "أنت مساعد برمجي. أجب باختصار وأعد JSON صالحًا عند الطلب."
},
{
"role": "user",
"content": "اكتب دالة JavaScript تجمع رقمين وأعد النتيجة بصيغة JSON."
}
],
"temperature": 0.2
}'
مثال Node.js إذا كنت تستخدم SDK متوافقًا مع OpenAI:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DEEPSEEK_API_KEY,
baseURL: "https://api.deepseek.com",
});
const completion = await client.chat.completions.create({
model: "deepseek-v4-pro",
messages: [
{
role: "system",
content: "أنت مساعد برمجي. أعد JSON صالحًا فقط عند طلب ذلك.",
},
{
role: "user",
content: "أعد مثال JSON لمستخدم يحتوي id وname وemail.",
},
],
temperature: 0.2,
});
console.log(completion.choices[0].message.content);
كيف يقارن V4-Pro الآن بـ GPT-5.5 و Claude Opus 4.7 و Gemini 3.5 Flash
المقارنة العملية ليست مع سعر V4-Pro القديم فقط، بل مع النماذج التي قد تستخدمها في الإنتاج اليوم.
| النموذج | الإدخال ($/مليون رمز) | الإخراج ($/مليون رمز) | SWE-bench Pro |
|---|---|---|---|
| DeepSeek-V4-Pro الجديد | $0.435 | $0.87 | 55.4% |
| GPT-5.5 | $5.00 | $30.00 | 58.6% |
| Claude Opus 4.7 | $3.00 | $15.00 | ~62% |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | ~48% |
| DeepSeek-V4-Flash | $0.14 | $0.28 | ~42% |
بالنسبة لرموز الإخراج، DeepSeek-V4-Pro أرخص بـ 34 مرة من GPT-5.5 و17 مرة أرخص من Claude Opus 4.7. أما من ناحية المعايير، فإن V4-Pro يقع ضمن 3 إلى 7 نقاط مئوية من GPT-5.5 في معظم تقييمات البرمجة والاستدلال العامة، وفقًا لمقارنة DataCamp.
القرار العملي:
- إذا كان حملك يتحمل فرقًا بسيطًا في الجودة وزمن الوصول، اختبر V4-Pro كبديل مباشر.
- إذا كانت آخر 5 نقاط من الجودة مهمة، استخدم V4-Pro للمسارات الأسهل واحتفظ بالنموذج الأغلى للمسارات الصعبة.
- إذا كان لديك وكيل متعدد الخطوات، جرّب V4-Pro كـ draft model أو model للخطوات الوسيطة.
للمقارنات التفصيلية، راجع:
- DeepSeek V4 مقابل Claude Opus 4.5 للبرمجة
- GLM-5 مقابل DeepSeek V3 مقابل GPT-5: السرعة، التكلفة، ومقارنة عملية للمطورين
زاوية التخزين المؤقت التي تفوتها معظم المقالات
الرقم الأكثر انتشارًا هو 0.87 دولار للإخراج. لكن الرقم الذي يغير تصميم النظام هو:
0.003625 دولار لكل مليون رمز إدخال عند cache hit
تحدث cache hits عندما تكون بادئة الطلب مطابقة تمامًا بالبايت لطلب سابق حديث، ضمن نافذة زمنية تقارب 30 دقيقة. في تطبيقات الوكلاء وRAG، البادئة غالبًا تكون:
system prompt
+ tool definitions
+ JSON schemas
+ formatting rules
+ few-shot examples
هذه البادئة قد تكون بين 4,000 و10,000 رمز، وغالبًا لا تتغير بين الطلبات.
حساب عملي
لنفترض:
- system prompt = 6,000 رمز
- 100,000 جولة دردشة يوميًا
- رسالة المستخدم = 200 رمز
- استجابة النموذج = 800 رمز
- 90% من رموز system prompt تحقق cache hit
بدون cache hits:
100,000 × 6,200 × 0.435 / 1,000,000
= 269.70 دولار يوميًا على الإدخال فقط
مع cache hits بنسبة 90% للبادئة:
تكلفة رسالة المستخدم:
100,000 × 200 × 0.435 / 1,000,000
= 8.70 دولار
تكلفة system prompt:
100,000 × 6,000 × ((0.9 × 0.003625) + (0.1 × 0.435)) / 1,000,000
≈ 28.05 دولار
الإجمالي ≈ 36.75 دولار يوميًا
حتى مع اختلاف طريقة الحساب حسب توزيع الطلبات، الاتجاه واضح: تثبيت البادئة قد يخفض تكلفة الإدخال بشكل كبير.
لشرح أعمق حول caching عبر المزودين، راجع: تحليلنا المتعمق للتخزين المؤقت للمطالبات.
كيف تصمم prompt ليستفيد من cache hits
1. ثبّت البادئة
اجعل هذه العناصر ثابتة وفي بداية الطلب:
- system prompt
- قواعد السلوك
- تعريفات الأدوات
- JSON schemas
- أمثلة few-shot
لا تضع في هذه المنطقة:
- user_id
- session_id
- timestamp
- request_id
- لغة المستخدم إذا كانت تتغير
- بيانات RAG المتغيرة
2. انقل المتغيرات إلى رسالة المستخدم
بدلًا من:
{
"role": "system",
"content": "أنت مساعد. الوقت الحالي: 2026-05-22. المستخدم: 123."
}
استخدم:
[
{
"role": "system",
"content": "أنت مساعد. اتبع التعليمات وأعد JSON صالحًا عند الطلب."
},
{
"role": "user",
"content": "السياق: الوقت الحالي 2026-05-22، المستخدم 123. السؤال: ..."
}
]
3. رتّب السياق الديناميكي بثبات
إذا كنت تستخدم RAG، فقم بفرز المقاطع المسترجعة بطريقة ثابتة:
const chunks = retrievedChunks.sort((a, b) => {
return a.documentId.localeCompare(b.documentId) || a.chunkIndex - b.chunkIndex;
});
التحولات الصغيرة في ترتيب المقاطع قد تمنع cache hit.
4. نفّذ طلب تسخين
عند تشغيل الخدمة، أرسل طلبًا قصيرًا يحتوي البادئة الكاملة لتدفئة cache:
await client.chat.completions.create({
model: "deepseek-v4-pro",
messages: [
{ role: "system", content: STATIC_SYSTEM_PROMPT },
{ role: "user", content: "ping" },
],
max_tokens: 1,
});
ما يجب عليك فعله هذا الأسبوع
قرار الترحيل ليس ثنائيًا. استخدم هذا الإطار العملي.
1. احسب نسبة الإخراج إلى الإدخال
اجمع من سجلاتك:
input_tokens_total
output_tokens_total
cache_hit_input_tokens
cost_by_model
cost_by_endpoint
إذا كان 70% أو أكثر من إنفاقك على الإخراج، فـ V4-Pro يستحق اختبارًا فوريًا.
2. اختبر 100 عينة من إنتاجك
لا تعتمد فقط على benchmark عام. خذ 100 طلب حقيقي من الإنتاج:
- 30 طلبًا عاديًا
- 30 طلبًا متوسط الصعوبة
- 20 طلبًا edge cases
- 20 طلبًا فشل أو إعادة محاولة
شغّلها على النموذج الحالي وV4-Pro بنفس prompt.
3. قيّم النتائج تلقائيًا ويدويًا
استخدم معايير مثل:
- هل الإجابة صحيحة؟
- هل JSON صالح؟
- هل استدعاء الأداة مطابق للمخطط؟
- هل اتبع النموذج سياسة المنتج؟
- هل احتاج الطلب إلى retry؟
- هل زاد زمن الاستجابة؟
للـ JSON structured output، أضف تحققًا صارمًا:
import Ajv from "ajv";
const ajv = new Ajv();
const schema = {
type: "object",
required: ["action", "arguments"],
properties: {
action: { type: "string" },
arguments: { type: "object" },
},
};
const validate = ajv.compile(schema);
if (!validate(JSON.parse(modelOutput))) {
console.error(validate.errors);
}
4. استخدم routing بدل الترحيل الكامل
ابدأ بمسارات منخفضة المخاطر:
V4-Pro:
- تلخيص
- تصنيف
- استخراج JSON
- مسودات كود
- ردود دعم أولية
النموذج الأغلى:
- قرارات مالية أو قانونية
- تخطيط وكيل طويل
- مهام ذات تكلفة فشل عالية
- حالات edge معقدة
مثال routing بسيط:
function selectModel(task) {
if (task.risk === "high") return "premium-model";
if (task.requiresLongPlanning) return "premium-model";
return "deepseek-v4-pro";
}
5. ثبّت بادئات التخزين المؤقت قبل القياس النهائي
قبل مقارنة التكلفة، تأكد أن prompt لا يكسر cache:
✅ system prompt ثابت
✅ tool schemas ثابتة
✅ ترتيب الأدوات ثابت
✅ لا timestamp في system prompt
✅ لا session_id في البادئة
✅ أمثلة few-shot لا تتغير
6. شغّل اختبارات الانحدار قبل الإنتاج
هنا يبرز دور Apidog. يمكنك تسجيل استجابات ذهبية من نموذجك الحالي، ثم إعادة تشغيل نفس الطلبات مقابل V4-Pro ومقارنة المخرجات. يلتقط تحقق JSON schema أي انحراف في أشكال استدعاء الأدوات قبل وصوله إلى الإنتاج.
خطوات عملية:
- قم بتنزيل Apidog.
- استورد مجموعتك المتوافقة مع OpenAI.
- غيّر عنوان URL الأساسي إلى:
https://api.deepseek.com
- أضف متغير بيئة:
DEEPSEEK_API_KEY=...
- شغّل نفس الطلبات على النموذجين.
- قارن:
- status code
- latency
- body shape
- JSON schema
- tool call arguments
- token usage
لجولة عملية حول نقطة نهاية V4-Pro، راجع: كيفية استخدام DeepSeek V4 API.
كيف يقارن V4-Pro بتخفيضات الأسعار الأخرى لعام 2026
DeepSeek ليس الوحيد الذي يخفض الأسعار. سوق LLM لعام 2026 يمر بضغط واضح على الهوامش:
- OpenAI O3 انخفض بنسبة 80% في وقت سابق من هذا العام. راجع تحليل تسعير O3.
- Kimi K2 أعادت تسعيرها بقوة للمنافسة مع فئة V3 من DeepSeek. راجع تسعير Kimi K2 API.
- Anthropic Claude حافظت على تسعير Opus لكنها قدمت فئات Haiku وSonnet الأرخص. راجع التحليل الكامل لتكلفة Claude API.
الفرق في حالة V4-Pro أن التخفيض يستهدف نطاق قدرات حدودية، وليس فقط فئة اقتصادية. لذلك تأثيره على قرارات البنية أكبر.
قائمة تحقق للترحيل
استخدم هذه القائمة قبل نقل أي حمل إنتاجي:
[ ] جمعت token usage الحالي لكل endpoint
[ ] حسبت input/output ratio
[ ] اخترت 100 عينة إنتاجية
[ ] شغلت مقارنة بين النموذج الحالي وV4-Pro
[ ] تحققت من JSON schema/tool calls
[ ] قست latency وretry rate
[ ] ثبّتت system prompt وtool schemas
[ ] أزلت المتغيرات من البادئة
[ ] أعددت routing للنماذج حسب المخاطر
[ ] أضفت مراقبة تكلفة يومية بعد الإطلاق
تغيرت معادلة البناء
لم يقم DeepSeek بتخفيض السعر فقط؛ لقد غيّر نقطة البداية لحساب تكلفة ميزات LLM. أصبحت القدرة الحدودية بسعر إخراج أقل من دولار لكل مليون رمز خيارًا عمليًا، وليست استثناءً.
ابدأ بثلاث خطوات:
- راجع أعلى ثلاثة أحمال LLM لديك واختر واحدًا لاختبار V4-Pro هذا الأسبوع.
- ثبّت بادئات التخزين المؤقت، لأن هذا يفيدك بغض النظر عن النموذج.
- اربط اختبارات الانحدار عبر Apidog حتى يصبح تقييم أي تخفيض سعر قادم مسألة ساعات لا أسابيع.
تم إزالة علامة الترويج. لكن الخصم لم يُلغَ.
Top comments (0)