نشرت DeepSeek تسعيرة V4 في نفس يوم صدور النماذج (23 أبريل 2026)، لتعيد تعريف معايير تكلفة الذكاء الاصطناعي الرائد. تقدم V4-Flash سعرًا يبلغ 0.14 دولار لكل مليون رمز إدخال و0.28 دولار لكل مليون رمز إخراج، بينما V4-Pro بسعر 1.74 دولار للإدخال و3.48 دولار للإخراج. كلا الإصدارين يدعمان نافذة سياق 1 مليون رمز وما يصل إلى 384 ألف رمز إخراج، مع خصم كبير على التكرار في الذاكرة المؤقتة يصل إلى 80–90% على المطالبات المتكررة.
في هذا الدليل ستجد بطاقة الأسعار الكاملة، شرحًا عمليًا لتأثير التخزين المؤقت على التكلفة الفعلية، مقارنة مباشرة مع GPT-5.5 وClaude Opus، وأربع إستراتيجيات عملية للحفاظ على الإنفاق متوقعًا عبر Apidog.
للاطلاع على نظرة عامة على المنتج، راجع ما هو DeepSeek V4. ولدليل المطور، راجع كيفية استخدام DeepSeek V4 API. وللمسارات المجانية، راجع كيفية استخدام DeepSeek V4 مجانًا.
ملخص سريع
- V4-Flash: 0.14 دولار / مليون إدخال (بدون تكرار)، 0.028 دولار / مليون إدخال (مع تكرار)، 0.28 دولار / مليون إخراج.
- V4-Pro: 1.74 دولار / مليون إدخال (بدون تكرار)، 0.145 دولار / مليون إدخال (مع تكرار)، 3.48 دولار / مليون إخراج.
- نافذة السياق: 1 مليون رمز إدخال، 384 ألف رمز إخراج، في كلا الإصدارين.
- خصم التكرار: خصم 80% على Flash، و92% على Pro عند المطالبات المتكررة.
- سيتم إيقاف
deepseek-chatوdeepseek-reasonerفي 24 يوليو 2026 وستتم محاسبتهما كسعر V4-Flash. - عند أسعار عدم التكرار، V4-Pro أرخص بـ 2.9 مرة في الإدخال و8.6 مرة في الإخراج مقارنة بـ GPT-5.5.
بطاقة الأسعار الكاملة
| النموذج | الإدخال (عدم تكرار) | الإدخال (تكرار) | الإخراج | السياق |
|---|---|---|---|---|
deepseek-v4-flash |
0.14 دولار / مليون | 0.028 دولار / مليون | 0.28 دولار / مليون | 1 مليون / 384 ألف |
deepseek-v4-pro |
1.74 دولار / مليون | 0.145 دولار / مليون | 3.48 دولار / مليون | 1 مليون / 384 ألف |
deepseek-chat (سيتم إيقافه 24-07-2026) |
يُحتسب كسعر V4-Flash غير متكرر | — | — | — |
deepseek-reasoner (سيتم إيقافه 24-07-2026) |
يُحتسب كسعر V4-Flash متكرر | — | — | — |
ملاحظات تنفيذية على الأسعار
- معرف النموذج هو ما يحدد السعر، ووضع التفكير يغير فقط عدد الرموز المستخدمة.
- خصم التخزين المؤقت تلقائي، ولا يحتاج لأي إعدادات إضافية. يجب أن تكون المقدمات 1024 رمزًا أو أكثر ومتطابقة حرفيًا.
- معرفات
deepseek-chatوdeepseek-reasonerالقديمة تُعامل حاليًا كأسماء مستعارة لـ V4-Flash؛ الموعد النهائي للترحيل هو 24 يوليو 2026.
التخزين المؤقت للسياق: شرح عملي
التخزين المؤقت هو مفتاح تخفيض التكلفة في DeepSeek V4. أي محتوى يتكرر (مثل prompts النظامية، مخططات الأدوات، أو سياق RAG) تتم محاسبته بجزء بسيط من السعر في الاستدعاءات اللاحقة.
مثال تطبيقي:
لديك وكيل بمطالبة نظامية من 20,000 رمز تظل ثابتة، وتطرح 100 سؤال (كل منها 200 رمز):
بدون تخزين مؤقت:
- الإدخال: 100 × 20,200 × 1.74 دولار / مليون = 3.52 دولار
- الإخراج: 100 × 500 × 3.48 دولار / مليون = 0.17 دولار
- الإجمالي: 3.69 دولار
مع التخزين المؤقت (استدعاء أول غير متكرر، 99 متكررة):
- إدخال الاستدعاء الأول: 20,200 × 1.74 دولار / مليون = 0.035 دولار
- 99 مقدمة متكررة: 99 × 20,000 × 0.145 دولار / مليون = 0.287 دولار
- 99 إدخال مستخدم غير متكرر: 99 × 200 × 1.74 دولار / مليون = 0.034 دولار
- الإخراج: 100 × 500 × 3.48 دولار / مليون = 0.174 دولار
- الإجمالي: 0.53 دولار
نسبة التوفير: أقل بـ 7 مرات لنفس عبء العمل. التأثير أكبر في V4-Flash بسبب انخفاض السعر الخام.
مقارنة مباشرة مع GPT-5.5 وClaude
| النموذج | الإدخال (عادي) | الإدخال (مخزن مؤقتًا) | الإخراج | السياق |
|---|---|---|---|---|
| DeepSeek V4-Flash | 0.14 دولار / مليون | 0.028 دولار / مليون | 0.28 دولار / مليون | 1 مليون |
| DeepSeek V4-Pro | 1.74 دولار / مليون | 0.145 دولار / مليون | 3.48 دولار / مليون | 1 مليون |
| GPT-5.5 | 5 دولارات / مليون | 1.25 دولار / مليون | 30 دولارًا / مليون | 1 مليون |
| GPT-5.5 Pro | 30 دولارًا / مليون | — | 180 دولارًا / مليون | 1 مليون |
| Claude Opus 4.6 | 15 دولارًا / مليون | 1.50 دولار / مليون | 75 دولارًا / مليون | 200 ألف |
أهم النقاط العملية من المقارنة:
- رموز الإخراج: V4-Pro أرخص 8.6 مرة من GPT-5.5، وأرخص 21 مرة من Claude Opus 4.6.
- الإدخال المخزن مؤقتًا: V4-Pro أرخص 10 مرات من GPT-5.5 المخزن مؤقتًا وClaude Opus.
- الأداء: V4-Pro يضاهي أو يتفوق على GPT-5.5 في LiveCodeBench وCodeforces مع تكلفة أقل بكثير.
ملاحظة: إذا كان عملك يعتمد على استرجاع دقيق لسياق طويل جدًا، لا تزال بعض النماذج الأخرى تتفوق في جودة الاسترجاع.
نمذجة التكلفة لأعباء العمل الشائعة
فيما يلي أربع سيناريوهات عملية مع حسابات تكلفة واضحة على V4-Pro (بدون تكرار):
1. حلقة ترميز وكيل (سياق 50K، إخراج 2K، 20 استدعاء لكل مهمة)
- الإدخال: 50,000 × 20 × 1.74 / 1,000,000 = 1.74 دولار
- الإخراج: 2,000 × 20 × 3.48 / 1,000,000 = 0.14 دولار
- التكلفة: ~1.88 دولار لكل مهمة (مقابل 6.20 دولار على GPT-5.5)
2. أسئلة وأجوبة مستندات طويلة (سياق 500K، إخراج 1K)
- الإدخال: 500,000 × 1.74 / 1,000,000 = 0.87 دولار
- الإخراج: 1,000 × 3.48 / 1,000,000 = 0.003 دولار
- التكلفة: ~0.87 دولار للاستدعاء (مقابل 2.53 دولار على GPT-5.5)
3. تصنيف عالي الحجم (سياق 2K، إخراج 200، 10,000 استدعاء) — استخدم V4-Flash
- الإدخال: 2,000 × 10,000 × 0.14 / 1,000,000 = 2.80 دولار
- الإخراج: 200 × 10,000 × 0.28 / 1,000,000 = 0.56 دولار
- التكلفة: ~3.36 دولار لكل 10,000 استدعاء (مقابل 110 دولار على GPT-5.5)
4. روبوت دردشة بمطالبة متكررة (مطالبة نظامية 10K، 500 رمز مستخدم، 1K إخراج، 1,000 جلسة)
- الاستدعاء الأول: 10,500 × 1.74 / 1,000,000 = 0.018 دولار
- 999 إدخال متكرر: 999 × 10,000 × 0.145 / 1,000,000 = 1.45 دولار
- 999 إدخال مستخدم غير متكرر: 999 × 500 × 1.74 / 1,000,000 = 0.87 دولار
- الإخراج: 1,000 × 1,000 × 3.48 / 1,000,000 = 3.48 دولار
- التكلفة: ~5.82 دولار/ 1,000 جلسة (مقابل 26.35 دولار على GPT-5.5 مع التخزين المؤقت)
التكاليف الخفية التي يجب مراقبتها
-
تضخم رموز وضع التفكير: وضع Think Max يستهلك رموز إخراج أكثر بـ3–10 مرات من Non-Think. راقب استخدام
reasoning_tokens. - نمو السياق الصامت: لا تغذِ الحوارات الكاملة في كل استدعاء؛ استخدم التلخيص أو الاقتصاص.
- عواصف إعادة المحاولة: أخطاء الشبكة أو API غير المستقرة قد تكرر الاستدعاء وتضاعف الفاتورة. أضف تراجعًا أسيًا وحدًا ثابتًا.
- تقلب التطوير: تكرار التجربة عبر curl يعيد تشغيل كامل السياق ويزيد التكلفة. استخدم Apidog لحفظ المتغيرات وجعل التعديل وإعادة المحاولة شبه مجانيين.
تتبع التكلفة في Apidog
اتبع هذا المسار لتتبع تكاليفك بدقة:
-
حمّل Apidog وخزّن متغير
DEEPSEEK_API_KEYكمتغير سري. - أنشئ طلب POST إلى
https://api.deepseek.com/v1/chat/completions. - في لوحة الاستجابة، تابع الحقول
usage.prompt_tokensوusage.completion_tokensوusage.reasoning_tokensلمراقبة التكلفة فورياً مع كل استدعاء. - اجعل
modelوthinking_modeمتغيرات حتى تستطيع اختبار V4-Flash وV4-Pro وNon-Think وThink Max بدون تكرار الطلبات. - كرر نفس الإعداد لـ GPT-5.5 (دليل API لـ GPT-5.5 يوضح نفس الخطوات). نافذة واحدة، مزودان، تكاليف واضحة.
هذا المسار يغطي 80% من مفاجآت الفواتير الشهرية في بيئة الإنتاج.
أربع قواعد للحفاظ على الإنفاق متوقعًا
- اجعل V4-Flash هو الافتراضي. استخدم V4-Pro فقط عند الحاجة الحقيقية لجودة أعلى مؤثرة على الإيرادات.
- ابدأ بـ Non-Think. انتقل إلى Think High للمهام الصعبة، واحتفظ بـ Think Max للمهام الحرجة فقط.
- حدّد max_tokens. سقف الإخراج 384 ألف رمز هو حماية وليس هدفًا. معظم حالات الإنتاج تكتفي بـ2 ألف رمز.
-
سجّل بيانات الاستخدام. تعقّب
prompt_tokensوcompletion_tokensوreasoning_tokensفي كل استدعاء، ونبّه عند ارتفاع رموز الاستدلال.
الأسئلة الشائعة
هل هناك طبقة مجانية؟
لا يوجد طبقة مجانية للاستخدام عبر API، لكن الحسابات الجديدة أحيانًا تحصل على رصيد تجريبي. للمسارات المجانية خارج الـ API، اطلع على كيفية استخدام DeepSeek V4 مجانًا.
كيف يعمل خصم التخزين المؤقت؟
المقدمات 1024 رمزًا أو أكثر والمتكررة عبر الطلبات داخل نفس الحساب تتم محاسبتها بسعر التكرار تلقائيًا. الاستدعاء الأول بسعر غير متكرر، والباقي بالسعر المخفض.
هل أوضاع التفكير أغلى؟
سعر الرمز ثابت، لكن أوضاع التفكير تستهلك رموزًا أكثر. راقب reasoning_tokens في كائن usage لمعرفة التكلفة الحقيقية.
هل التسعيرة مستقرة؟
DeepSeek تعدّل الأسعار دوريًا. راجع صفحة التسعيرة المباشرة قبل وضع الميزانية.
هل إخراج V4-Pro وV4-Flash بنفس السعر؟
لا. إخراج V4-Pro يكلف 3.48 دولار/مليون، في حين V4-Flash يكلف 0.28 دولار/مليون، بفارق 12.4x.
هل نقطة نهاية تنسيق Anthropic تغير التسعيرة؟
لا. endpoint https://api.deepseek.com/anthropic تستخدم نفس أسعار نقطة نهاية OpenAI. التنسيق لا يؤثر على الفوترة.
Top comments (0)