DEV Community

Cover image for أسعار Gemini 3.5 Flash: كم تكلّف فعلياً؟
Yusuf Khalidd
Yusuf Khalidd

Posted on • Originally published at apidog.com

أسعار Gemini 3.5 Flash: كم تكلّف فعلياً؟

أطلقت جوجل Gemini 3.5 Flash في 19 مايو 2026 مع وعد تسعيري واضح: “أقل من نصف تكلفة النماذج الرائدة الأخرى” للمهام الوكيلية. بدل التعامل مع العبارة كتسويق فقط، هذا الدليل يحولها إلى أرقام قابلة للتطبيق: تكلفة كل مليون رمز، متى تستخدم الطبقة المجانية، متى تختار وضع الدفعات، وكيف تحسب فاتورة عبء عملك قبل الإنتاج.

جرّب Apidog اليوم

ستجد هنا أسعار الإدخال والإخراج، حدود الطبقة المجانية، خصم وضع الدفعات، أمثلة تكلفة واقعية، ومقارنة مباشرة مع GPT-5.5 و Claude Opus 4.7. الهدف: أن تعرف متى يكون Gemini 3.5 Flash هو الخيار الافتراضي، ومتى تحتاج إلى توجيه بعض الطلبات إلى نموذج آخر.

Gemini 3.5 Flash pricing

ملخص سريع

نوع التكلفة المعدل
إدخال قياسي ~1.50 دولار / 1 مليون رمز
إخراج قياسي ~9.00 دولار / 1 مليون رمز
إدخال وضع الدفعات ~0.75 دولار / 1 مليون رمز (~خصم 50%)
إخراج وضع الدفعات ~4.50 دولار / 1 مليون رمز (~خصم 50%)
إدخال مخزن مؤقتًا معدل مخفض، ويختلف حسب الاستخدام
الطبقة المجانية في AI Studio ~1,500 طلب/يوم، 1 مليون رمز/دقيقة، 15 طلب/دقيقة
حساب Vertex AI جديد رصيد 300 دولار على مدى 90 يومًا

الأسعار المذكورة تعكس البيانات المتاحة في مايو 2026 حسب إعلان Google وقوائم المجمّعين. قبل اعتماد ميزانية إنتاجية، راجع دائمًا صفحة الأسعار الرسمية.

أسعار Gemini 3.5 Flash لكل رمز

يدفع Gemini 3.5 Flash حسب الاستخدام: تكلفة مستقلة لرموز الإدخال، وتكلفة مستقلة لرموز الإخراج.

المستوى الإدخال ($/1 مليون) الإخراج ($/1 مليون)
قياسي ~1.50 دولار ~9.00 دولار
إدخال مخزن مؤقتًا مخفض غير متاح
دفعة غير متزامنة ~0.75 دولار ~4.50 دولار

نقطتان مهمتان عند الحساب:

  • الرموز ليست كلمات. كقاعدة تقريبية: 1,000 رمز ≈ 750 كلمة إنجليزية. مستند من 100,000 كلمة قد يساوي تقريبًا 133,000 رمز.
  • الإخراج أغلى بكثير من الإدخال. إذا كان التطبيق يولّد إجابات طويلة، فالفاتورة ستتأثر بالإخراج أكثر من الإدخال. لذلك، استخدم مخرجات مهيكلة مثل JSON عندما يكون ذلك ممكنًا.

معادلة الحساب الأساسية:

التكلفة = (رموز الإدخال / 1,000,000 × سعر الإدخال)
        + (رموز الإخراج / 1,000,000 × سعر الإخراج)
Enter fullscreen mode Exit fullscreen mode

مثال سريع:

100,000 طلب/شهر
500 رمز إدخال لكل طلب
300 رمز إخراج لكل طلب

الإدخال = 100,000 × 500 × 1.50 / 1,000,000 = 75 دولار
الإخراج = 100,000 × 300 × 9.00 / 1,000,000 = 270 دولار

الإجمالي ≈ 345 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

للاطلاع على خلفية حول تشغيل المهام غير المتزامنة، راجع وضع الدفعات في Gemini API متوفر الآن وأرخص بنسبة 50%.

الطبقة المجانية: متى تكفي؟

تتوفر الطبقة المجانية من AI Studio مع Flash منذ اليوم الأول. حدود الإطلاق:

  • 1,500 طلب يوميًا
  • 1 مليون رمز في الدقيقة
  • 15 طلبًا في الدقيقة

هذه الحدود مناسبة عادةً لـ:

  • النماذج الأولية
  • أدوات داخلية صغيرة
  • تجارب المطالبات
  • أتمتة شخصية أو محدودة
  • اختبارات التكامل قبل الإنتاج

تفاصيل مهمة:

  • لا تتطلب بطاقة ائتمان.
  • تستخدم نفس نموذج gemini-3.5-flash في نقطة النهاية المدفوعة.
  • تستخدم نفس نمط SDK تقريبًا، مع اختلاف المفتاح أو المشروع.
  • قد تُستخدم المطالبات لتحسين نماذج Google، ويمكن تعطيل ذلك من إعدادات AI Studio.
  • الحصص قد تتغير؛ لا تبنِ نظامًا إنتاجيًا على رقم 1,500 طلب/يوم كضمان دائم.

خطوة عملية قبل الإنتاج:

  1. شغّل التطبيق على الطبقة المجانية.
  2. سجّل عدد الطلبات اليومي.
  3. سجّل متوسط رموز الإدخال والإخراج.
  4. احسب التكلفة الشهرية المتوقعة.
  5. انتقل إلى الطبقة المدفوعة فقط عندما تصبح الحصص عائقًا.

لإعداد المفتاح والبدء، راجع كيفية استخدام Gemini 3.5 Flash مجانًا وكيفية الحصول على مفتاح Gemini API من Google مجانًا.

وضع الدفعات: الخصم الأكبر إذا لم تكن تحتاج إلى رد فوري

إذا كان عبء العمل لا يحتاج إلى استجابة فورية، استخدم وضع الدفعات. التكلفة تنخفض تقريبًا إلى النصف:

  • إدخال: ~0.75 دولار / 1 مليون رمز
  • إخراج: ~4.50 دولار / 1 مليون رمز

آلية العمل:

  1. تجمع المطالبات في مهمة واحدة.
  2. ترسلها كدفعة غير متزامنة.
  3. تعالجها Google خلال مدة قد تصل إلى 24 ساعة.
  4. تدفع حوالي 50% أقل لكل من الإدخال والإخراج.

متى تستخدمه:

  • تحليل مستندات بكميات كبيرة
  • مراجعة تذاكر دعم العملاء
  • تصنيف أو تلخيص محتوى ليلي
  • معالجة بيانات تاريخية
  • توليد تقارير دورية
  • استخراج بيانات من صور أو PDFs غير عاجلة

متى لا تستخدمه:

  • واجهات الدردشة المباشرة
  • وكلاء يتفاعلون مع المستخدم في الوقت الحقيقي
  • أي سير عمل يحتاج ردًا خلال ثوانٍ

قرار بسيط:

هل يمكن للمستخدم أو النظام انتظار ساعات؟
نعم  -> استخدم batch mode
لا   -> استخدم الاستدعاء القياسي
Enter fullscreen mode Exit fullscreen mode

تفاصيل الإعداد موجودة في دليل وضع الدفعات الخاص بنا.

الإدخال المخزن مؤقتًا: وفر عندما تتكرر البادئة

إذا كانت معظم طلباتك تبدأ بنفس السياق الطويل، فالتخزين المؤقت للسياق قد يخفض تكلفة الإدخال.

أمثلة على السياق المتكرر:

  • مطالبة نظام طويلة
  • وثيقة مرجعية كبيرة
  • تعليمات امتثال داخلية
  • كتالوج منتجات
  • سياسة دعم العملاء
  • مجموعة أمثلة ثابتة

النمط العملي:

  1. خزّن السياق الطويل مرة واحدة.
  2. أعد استخدامه عبر طلبات متعددة.
  3. ادفع السعر الكامل فقط على الجزء الجديد من الطلب.
  4. ادفع سعرًا مخفضًا على الجزء المخزن مؤقتًا.

مثال:

سياق ثابت: 100,000 رمز
سؤال جديد: 500 رمز
إخراج: 700 رمز

بدون caching:
تدفع على 100,500 رمز إدخال في كل طلب.

مع caching:
تدفع السعر الكامل على 500 رمز جديد،
وتدفع معدلًا مخفضًا على السياق الثابت عند إعادة استخدامه.
Enter fullscreen mode Exit fullscreen mode

هذا مهم خصوصًا لتطبيقات RAG أو أدوات تحليل المستندات التي تعيد استخدام نفس المراجع.

سيناريوهات تكلفة واقعية

السيناريو الأول: روبوت دردشة لدعم العملاء

الافتراضات:

  • 10,000 رسالة مستخدم يوميًا
  • 200 رمز إدخال لكل رسالة
  • 400 رمز إخراج لكل رد

الحساب:

الإدخال:
10,000 × 200 × 1.50 / 1,000,000 = 3 دولار/يوم

الإخراج:
10,000 × 400 × 9.00 / 1,000,000 = 36 دولار/يوم

الإجمالي:
≈ 39 دولار/يوم
≈ 1,170 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

إذا كانت الردود لا تحتاج إلى وقت حقيقي ويمكن تجميعها، فإن وضع الدفعات يخفضها تقريبًا إلى:

≈ 585 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

لكن لمعظم روبوتات الدردشة، ستحتاج إلى الاستدعاء القياسي لأن المستخدم ينتظر ردًا فوريًا.

السيناريو الثاني: خدمة SaaS للأسئلة والأجوبة على المستندات

الافتراضات:

  • 1,000 مستند يوميًا
  • 30,000 رمز إدخال لكل مستند
  • 500 رمز إخراج لكل إجابة

الحساب:

الإدخال:
1,000 × 30,000 × 1.50 / 1,000,000 = 45 دولار/يوم

الإخراج:
1,000 × 500 × 9.00 / 1,000,000 = 4.50 دولار/يوم

الإجمالي:
≈ 50 دولار/يوم
≈ 1,500 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

هنا تفيد نافذة السياق الكبيرة. بدل بناء تقسيم معقد للمستندات، يمكنك إرسال المستند كاملًا عندما يكون ذلك مناسبًا، ثم تقيس الجودة والتكلفة.

السيناريو الثالث: وكيل مستقل طويل الأمد

الافتراضات:

  • تشغيل واحد للوكيل = 50 دورة نموذج
  • كل دورة: 5,000 رمز إدخال و1,000 رمز إخراج
  • 200 تشغيل يوميًا

تكلفة التشغيل الواحد:

الإدخال:
50 × 5,000 × 1.50 / 1,000,000 = 0.375 دولار

الإخراج:
50 × 1,000 × 9.00 / 1,000,000 = 0.45 دولار

الإجمالي لكل تشغيل:
≈ 0.83 دولار
Enter fullscreen mode Exit fullscreen mode

التكلفة اليومية:

200 × 0.83 = 166 دولار/يوم تقريبًا
≈ 4,950 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

للمقارنة، نفس النمط على نموذج أعلى تكلفة مثل Opus 4.7 قد يكون أعلى بكثير بسبب فرق أسعار الإدخال والإخراج. هذا هو النوع من أعباء العمل الذي يظهر فيه فرق التكلفة الوكيلية بوضوح.

السيناريو الرابع: استخراج بيانات من لقطات شاشة للرسوم البيانية

الافتراضات:

  • 5,000 لقطة شاشة يوميًا
  • كل صورة تعادل تقريبًا 1,500 رمز إدخال
  • إخراج JSON مهيكل من 300 رمز

الحساب:

الإدخال:
5,000 × 1,500 × 1.50 / 1,000,000 = 11.25 دولار/يوم

الإخراج:
5,000 × 300 × 9.00 / 1,000,000 = 13.50 دولار/يوم

الإجمالي:
≈ 25 دولار/يوم
≈ 750 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

إذا كان الاستخراج غير عاجل، استخدم وضع الدفعات:

≈ 375 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

واستخدم JSON لتقليل حجم الإخراج بدل رد نصي طويل.

السيناريو الخامس: إنشاء محتوى بكميات كبيرة

الافتراضات:

  • 100,000 مقال قصير يوميًا
  • 500 رمز إدخال لكل مقال
  • 2,000 رمز إخراج لكل مقال

الحساب:

الإدخال:
100,000 × 500 × 1.50 / 1,000,000 = 75 دولار/يوم

الإخراج:
100,000 × 2,000 × 9.00 / 1,000,000 = 1,800 دولار/يوم

الإجمالي:
≈ 1,875 دولار/يوم
≈ 56,250 دولار/شهر
Enter fullscreen mode Exit fullscreen mode

هنا الإخراج هو مركز التكلفة. لتقليل الفاتورة:

  • استخدم وضع الدفعات إذا كان النشر غير فوري.
  • قلل طول الإخراج بتحديد قالب صارم.
  • وجّه المهام السهلة إلى نماذج أرخص مثل 3.1 Flash-Lite.
  • استخدم Flash فقط عندما تحتاج إلى جودة أعلى.

مقارنة التكلفة مع GPT-5.5 و Opus 4.7

النموذج الإدخال ($/1 مليون) الإخراج ($/1 مليون) المضاعف مقارنة بـ Flash
Gemini 3.5 Flash ~1.50 دولار ~9.00 دولار
GPT-5.5 ~10 دولارات ~30 دولار 6.7× إدخال، 3.3× إخراج
Claude Opus 4.7 ~15 دولار ~75 دولار 10× إدخال، 8.3× إخراج

تطبيق السيناريو الأول، دردشة دعم العملاء، على النماذج الثلاثة:

  • Gemini 3.5 Flash: ~39 دولار/يوم
  • GPT-5.5: ~140 دولار/يوم
  • Claude Opus 4.7: ~330 دولار/يوم

الاستنتاج العملي: لا تجعل النموذج الأعلى تكلفة هو الافتراضي لكل طلب. ابدأ بـ Flash، ثم وجّه الطلبات الصعبة فقط إلى نموذج أغلى عند الحاجة.

للمزيد، راجع تسعير GPT-5.5 والمقارنة الثلاثية.

مقارنة التكلفة مع إصدارات Gemini الأخرى

النموذج الإدخال ($/1 مليون) الإخراج ($/1 مليون) متى يُستخدم
Gemini 3.1 Flash-Lite ~0.40 دولار ~2.00 دولار العمل الروتيني بكميات كبيرة
Gemini 3 Flash ~0.50 دولار ~3.00 دولارات الجيل السابق، لا يزال قويًا
Gemini 3.1 Pro ~2.00 دولار ~12.00 دولار مهام استدلال أثقل قبل 3.5 Pro
Gemini 3.5 Flash ~1.50 دولار ~9.00 دولار الافتراضي الجديد لمعظم أعباء العمل
Gemini 3.5 Pro (يونيو 2026) سيُحدد لاحقًا سيُحدد لاحقًا أصعب مهام الاستدلال

Flash أغلى من بعض إصدارات Flash السابقة، لكنه يقدم توازنًا أفضل بين الجودة والتكلفة لمعظم الفرق. النمط العملي:

مهام سهلة ومتكررة       -> Flash-Lite
مهام عامة وإنتاجية      -> Gemini 3.5 Flash
مهام استدلال صعبة جدًا -> Pro أو نموذج رائد آخر
Enter fullscreen mode Exit fullscreen mode

راجع أيضًا 3.1 Flash-Lite، تسعير 3.0 API، و3 Flash.

تسعير Vertex AI للإنتاج

إذا استدعيت Gemini 3.5 Flash عبر Vertex AI بدل AI Studio، فتكلفة الرمز نفسها عادةً. الفرق يكون في طبقة التشغيل المؤسسي:

  • مصادقة عبر حسابات الخدمة بدل مفاتيح API
  • سجلات تدقيق في Cloud Logging
  • ضوابط إقامة البيانات
  • لا توجد طبقة مجانية
  • رصيد 300 دولار للحسابات الجديدة
  • حصص مخصصة يمكن التفاوض عليها عند التوسع

مسار عملي لمعظم الفرق:

  1. ابدأ في AI Studio المجاني.
  2. انتقل إلى AI Studio المدفوع عندما تتجاوز الحصص.
  3. انتقل إلى Vertex AI عندما تحتاج إلى ضوابط مؤسسية أو سجلات تدقيق أو إعدادات بيانات أكثر صرامة.

تحسين التكلفة: خطوات قابلة للتطبيق

1. سجل الرموز لكل طلب

أضف logging بسيطًا لرموز الإدخال والإخراج. بدون ذلك، لن تعرف أي المطالبات ترفع الفاتورة.

مثال بنية سجل:

{
  "model": "gemini-3.5-flash",
  "route": "/support/reply",
  "input_tokens": 842,
  "output_tokens": 311,
  "estimated_cost_usd": 0.0041,
  "latency_ms": 1280
}
Enter fullscreen mode Exit fullscreen mode

2. استخدم JSON بدل النص الحر

بدل مطالبة مثل:

اشرح المشكلة بالتفصيل وأعطني توصياتك.
Enter fullscreen mode Exit fullscreen mode

استخدم صيغة مخرجات محددة:

{
  "summary": "string",
  "category": "billing | bug | feature_request | other",
  "priority": "low | medium | high",
  "next_action": "string"
}
Enter fullscreen mode Exit fullscreen mode

الفائدة:

  • إخراج أقصر
  • parsing أسهل
  • تكلفة أقل
  • اختبارات أوضح

3. وجّه الطلبات حسب الصعوبة

لا ترسل كل شيء إلى نفس النموذج. أضف طبقة routing بسيطة:

إذا كان الطلب تصنيفًا بسيطًا      -> Flash-Lite
إذا كان تحليلًا متوسطًا          -> Gemini 3.5 Flash
إذا كان استدلالًا عالي المخاطر    -> نموذج أقوى
Enter fullscreen mode Exit fullscreen mode

4. استخدم batch mode لأي عمل غير فوري

اسأل قبل كل مهمة:

هل يحتاج المستخدم النتيجة الآن؟
Enter fullscreen mode Exit fullscreen mode

إذا لا، فغالبًا يجب أن تكون المهمة دفعة.

5. خزّن السياق الثابت

إذا كانت مطالبة النظام أو الوثيقة المرجعية تظهر في كل طلب، استخدم context caching بدل إرسالها كاملة كل مرة.

6. تحقق من الطلبات قبل إرسالها للنموذج

لا تهدر الرموز على payload غير صالح أو مدخلات ناقصة. يمكن لـ Apidog مساعدتك في اختبار نقطة نهاية Gemini، التحقق من شكل الطلب، وإضافة assertions على الاستجابة قبل تشغيلها بكثافة.

سير عمل عملي:

  1. أنشئ request لنقطة نهاية Gemini في Apidog.
  2. أضف أمثلة payload حقيقية.
  3. أضف assertions على status code وشكل JSON.
  4. اختبر الحالات الفاشلة.
  5. شغّلها قبل إدخالها في pipeline الإنتاج.

متى تترك الطبقة المجانية؟

انتقل من المجاني إلى المدفوع عندما تظهر إحدى هذه الإشارات:

  1. تصل إلى 1,500 طلب/يوم عدة أيام متتالية.

    في هذه المرحلة، وقتك في الالتفاف على الحصة أغلى من الدفع.

  2. تحتاج RPM أعلى.

    حد 15 طلبًا/دقيقة مناسب للتجارب، لكنه قد يقيّد واجهات الإنتاج.

  3. تحتاج إلى سجلات تدقيق أو إقامة بيانات.

    هنا يصبح Vertex AI الخيار الأنسب.

تجد كثير من الفرق أن 50-200 دولار شهريًا على Flash المدفوع تكفي لإزالة معظم قيود النموذج الأولي.

مخاطر التسعير التي يجب مراقبتها

قبل تثبيت الميزانية، راقب هذه النقاط:

  • تغير الحصص: قد تتغير حدود الطبقة المجانية بمرور الوقت.
  • إطلاق 3.5 Pro: قد يؤثر على موضع Flash أو أسعاره.
  • اختلافات المناطق في Vertex AI: بعض المناطق قد تضيف تكلفة أعلى.
  • تضخم الإخراج: ردود طويلة غير مضبوطة ترفع الفاتورة بسرعة.
  • المطالبات الشاذة: عدد صغير من الطلبات الضخمة قد يصنع معظم التكلفة.

إجراء وقائي:

ضع تنبيهًا يوميًا للميزانية من اليوم الأول.
Enter fullscreen mode Exit fullscreen mode

في AI Studio، راقب حصص المشروع. في Vertex AI، استخدم Cloud Billing budgets والتنبيهات.

الخلاصة

Gemini 3.5 Flash مناسب كبداية لمعظم أعباء عمل الذكاء الاصطناعي الإنتاجية في 2026. السعر القياسي، حوالي 1.50 دولار للإدخال و9 دولارات للإخراج لكل مليون رمز، يجعله أرخص بكثير من نماذج رائدة أخرى في كثير من السيناريوهات.

أفضل استراتيجية ليست اختيار نموذج واحد لكل شيء، بل بناء توجيه ذكي:

  • Flash-Lite للمهام السهلة والكثيفة
  • Gemini 3.5 Flash كافتراضي إنتاجي
  • نماذج أقوى للطلبات النادرة والصعبة
  • batch mode لكل ما لا يحتاج إلى رد فوري
  • context caching للسياقات المتكررة

لتطبيق ذلك عمليًا:

  1. احفظ نقطة نهاية Gemini 3.5 Flash كطلب في Apidog.
  2. اختبر 20 مطالبة حقيقية من تطبيقك.
  3. سجّل رموز الإدخال والإخراج.
  4. احسب التكلفة الشهرية المتوقعة.
  5. قارن الجودة مع نموذجك الحالي.
  6. قرر أين يحل Flash محل نموذج أغلى، وأين لا يفعل ذلك.

هذا التقييم يستغرق عادةً يومًا أو يومين، وغالبًا يعوض تكلفته في أول دورة فاتورة.

Top comments (0)