DEV Community

Cover image for فوجو ألترا ضد فابل 5 ضد ميثوس: مقارنة ساكانا أوركستريتور بفرونتير
Yusuf Khalidd
Yusuf Khalidd

Posted on • Originally published at apidog.com

فوجو ألترا ضد فابل 5 ضد ميثوس: مقارنة ساكانا أوركستريتور بفرونتير

Fugu Ultra هو الإصدار الأبرز من Fugu من Sakana AI. تقدمه Sakana كنظام يصل إلى مستوى النماذج الرائدة، لا كنموذج يتفوق عليها. وفقاً لـ Sakana، فإن Fugu Ultra "يقف جنباً إلى جنب مع النماذج الرائدة مثل Fable 5 وMythos Preview" في معايير الهندسة والعلوم والاستدلال. النقطة العملية المهمة: Fugu ليس نموذجاً فردياً مثل نماذج Anthropic، بل منسق يستدعي نماذج بائعين آخرين خلف واجهة API واحدة. التفاصيل الرسمية متاحة في صفحة إصدار Sakana Fugu، ويمكنك قراءة تحليل أوسع في ما هو Sakana Fugu.

جرّب Apidog اليوم

ما الذي تقارنه فعلياً؟

Fugu هو نظام تنسيق متعدد الوكلاء يُقدَّم كنموذج أساسي واحد خلف واجهة API واحدة متوافقة مع OpenAI. تصفه Sakana بأنه نموذج لغوي مدرب على:

  • التفويض بين الوكلاء
  • تواصل الوكلاء
  • تجميع العمل
  • اختيار النموذج المناسب لكل طلب

أي أن Fugu قد يجيب مباشرة، أو يكوّن فريقاً من نماذج LLM متعددة، بما في ذلك نسخ متكررة من نفسه. لذلك عنوان الإصدار: "نموذج واحد لقيادة الجميع".

Fugu architecture

أما Fable 5 وMythos فهما مختلفان: كلاهما نموذج فردي من Anthropic. Fable 5 هو أقوى نموذج Anthropic متاح بشكل عام، وهو نموذج من "فئة Mythos" صُمم ليكون آمناً للاستخدام العام، ويقع فوق Opus 4.8. أما Mythos Preview، الصادر في 7 أبريل 2026، فهو النموذج الرائد الذي وصفته Anthropic بأنه خطير للغاية بحيث لا يمكن إصداره.

تفصيل مهم: Sakana قارنت Fugu Ultra مع Mythos Preview الأقدم، وليس Mythos 5 الحالي. نغطي هذا الجانب في Fable 5 vs Mythos 5 وشرح نموذج فئة Mythos.

الخلاصة: أنت لا تقارن نموذجاً واحداً بنموذج واحد. أنت تقارن منسقاً متعدد النماذج بنماذج فردية.

Fugu وFugu Ultra باختصار

يتوفر Fugu في إصدارين عبر نقطة نهاية واحدة:

الإصدار الاستخدام المناسب
fugu مهام يومية، برمجة، مراجعة كود، روبوتات دردشة، خدمات تفاعلية، وزمن استجابة أقل
fugu-ultra جودة أعلى للإجابات، أبحاث الذكاء الاصطناعي، إعادة إنتاج الأوراق البحثية، الأمن السيبراني، البحث في الأدبيات وبراءات الاختراع

أطلقت النسخة التجريبية وبعض التغطيات الإعلامية على الإصدار الأصغر اسم "Fugu Mini"، لكن صفحة الإصدار تستخدم اسمي Fugu وFugu Ultra. استخدم هذه الأسماء عند بناء التكامل.

Fugu variants

النقطة الحاسمة: منسق مقابل نموذج فردي

لا تتعامل مع نتائج Fugu كما لو كانت نتائج نموذج فردي.

Fugu هو منسق. عندما ينتج إجابة قوية، فقد يكون قد فعل ذلك عبر استدعاء نموذج رائد آخر مثل Opus 4.8 أو Gemini، ثم أضاف طبقة تخطيط أو تحقق أو توليف فوق النتيجة.

هذا مهم عند قراءة أي نتيجة مثل:

Fugu يتفوق على Opus 4.8 في مهمة معينة.

قد يكون Fugu وصل إلى تلك النتيجة باستخدام Opus 4.8 داخل الحلقة. هذا لا يجعل النتيجة غير مفيدة، لكنه يجعلها فوزاً للنظام ككل، لا دليلاً على أن "أوزان" Fugu وحدها أقوى من Opus.

أما Fable 5 وMythos فهما نموذجان فرديان يجيبان من خلال أوزانهما الخاصة.

لذلك القراءة الدقيقة هي:

نظام منسق وصل إلى جودة تضاهي النماذج الرائدة، جزئياً عبر التوجيه إلى نماذج رائدة.

وليست:

Fugu يتفوق على Fable 5.

للتفاصيل الخاصة بالأرقام، راجع معايير Sakana Fugu.

المستوى الأول: التكافؤ مع Fable 5 وMythos Preview

ادعاء Sakana الأساسي هو التكافؤ. تقول Sakana إن Fugu Ultra يقف جنباً إلى جنب مع Fable 5 وMythos Preview عبر معايير الهندسة والعلوم والاستدلال.

هذا يعني:

  • لا يوجد ادعاء رسمي بأن Fugu Ultra يتفوق على Fable 5.
  • المقارنة مع Mythos Preview، لا Mythos 5.
  • التكافؤ هنا على مستوى النظام، لا بالضرورة على مستوى نموذج أساسي واحد.

هناك نقطتان عمليتان يجب الانتباه لهما عند تقييم هذا الادعاء.

1. المقارنة مع Mythos Preview وليست Mythos 5

Mythos Preview هو نموذج أبريل 2026، وليس النموذج الحالي Mythos 5. وفقاً لأسعار Anthropic بتاريخ 9 يونيو 2026:

النموذج إدخال لكل مليون رمز إخراج لكل مليون رمز
Fable 5 10 دولارات 50 دولاراً
Mythos 5 10 دولارات 50 دولاراً
Mythos Preview 25 دولاراً 125 دولاراً

اختيار نموذج Preview قد يكون مناسباً لمقارنة قابلة للتكرار، لكنه لا يعني أن Fugu Ultra قيس مقابل السقف الحالي.

2. الآلية أهم من الرقم الخام

إذا وصل Fugu Ultra إلى مستوى Fable 5 عبر تنسيق فريق من النماذج، فهذا تكافؤ حقيقي على مستوى النظام. لكنه لا يثبت أن نموذجاً داخلياً واحداً في Fugu يساوي Fable 5 وحده.

لرؤية موقع Fable 5 مقابل Opus 4.8، راجع Claude Fable 5 vs Opus 4.8.

المستوى الثاني: أين تدعي Sakana أن Fugu يتفوق؟

هذا ادعاء مختلف عن التكافؤ مع Fable 5 وMythos Preview.

وفقاً لـ Sakana، يتفوق Fugu باستمرار على هذه النماذج في تطبيقات محددة:

  • Gemini 3.1 Pro High
  • Opus 4.8 Max
  • GPT 5.5 Ultra High

لكن نطاق الادعاء ضيق. التطبيقات المذكورة تشمل:

  • AutoResearch
  • مكعب روبيك
  • التصميم الميكانيكي
  • تحليل الخط اليدوي الياباني
  • الشطرنج بضربة واحدة
  • التنبؤ بالسلاسل الزمنية المالية

هذه ليست انتصارات عامة على كل المعايير. إنها نتائج على مستوى التطبيق.

وهذا منطقي تقنياً: المهام المنظمة متعددة الخطوات تناسب منسقاً يستطيع التخطيط، التفويض، التحقق، وإعادة المحاولة. هنا تحديداً تضيف طبقة التنسيق قيمة.

الصياغة الأدق:

تضيف طبقة التنسيق في Fugu قيمة قابلة للقياس في المهام المنظمة والقابلة للتحقق، وأحياناً تكفي للتفوق على نموذج رائد واحد في مهمة محددة.

جدول مقارنة سريع

اقرأ صف "نوع النظام" أولاً. هذا هو الفرق الأساسي.

البُعد Fugu / Fugu Ultra Fable 5 Mythos Preview / Mythos 5
نوع النظام منسق يستدعي نماذج LLM متعددة، بما في ذلك نفسه نموذج Anthropic فردي نموذج Anthropic فردي
البائع Sakana AI Anthropic Anthropic
ادعاء Sakana تكافؤ مع Fable 5 وMythos Preview نظير تكافؤ مسمى Mythos Preview هو النظير، وليس Mythos 5
ادعاء التفوق المنفصل مقابل Gemini 3.1 Pro وOpus 4.8 وGPT 5.5 في تطبيقات محددة ليس هدف التفوق ليس هدف التفوق
التسعير مستويات مبلّغ عنها + دفع حسب الاستخدام، غير مؤكدة بالكامل 10 دولارات إدخال / 50 دولاراً إخراج لكل مليون رمز Preview: 25 / 125 دولاراً، Mythos 5: 10 / 50 دولاراً
API نقطة نهاية واحدة متوافقة مع OpenAI Anthropic API Anthropic API
القوة مهام متعددة الخطوات، حوكمة، توجيه، تحقق جودة عامة عالية وآمنة للاستخدام العام أعلى سقف رائد

أرقام Fugu السعرية مبلّغ عنها وليست مؤكدة من صفحة الإصدار نفسها. تعامل معها كأرقام تحتاج إلى تحقق مباشر. للمزيد حول درجات Fable 5، راجع معايير Claude Fable 5.

التسعير: ما الذي يمكنك الاعتماد عليه؟

أكدت Sakana بنية التسعير التالية:

  • مستويات اشتراك للاستخدام اليومي
  • خطة دفع حسب الاستخدام للأحمال الأكبر والمؤسسية

لكن الأرقام التفصيلية غير مؤكدة بالكامل اعتباراً من 22 يونيو 2026. الأرقام المتداولة تأتي من مصادر ثانوية أو صفحات تعتمد على JavaScript، وليست من صفحة الإصدار الرسمية.

الأرقام المبلّغ عنها:

  • اشتراكات شهرية تقريبية: 20 / 100 / 200 دولار
  • عرض إطلاق: شهر ثانٍ مجاني عند الاشتراك قبل نهاية يوليو 2026
  • دفع حسب الاستخدام:
    • 5 دولارات تقريباً لكل مليون رمز إدخال
    • 30 دولاراً تقريباً لكل مليون رمز إخراج
    • 0.50 دولار تقريباً للمخزن المؤقت لكل مليون رمز
    • رسوم إضافية للسياق فوق 272 ألف رمز
  • الإصدار الأساسي fugu يقال إنه يُحاسب بتكلفة النموذج الأساسي الذي يستدعيه
  • لا يوجد مستوى مجاني مستقل مؤكد

لا تبنِ ميزانيتك على هذه الأرقام قبل تأكيدها في لوحة التحكم الخاصة بك.

الخلفية البحثية: ماذا يثبت Fugu وماذا لا يثبت؟

Sakana لم تخترع فكرة التنسيق بين النماذج. منهجية Mixture-of-Agents من Together AI، المنشورة في ICLR 2025، أظهرت بالفعل أن تنسيق عدة نماذج يمكن أن يتفوق على نموذج واحد.

ما يميز Fugu هو تقديم منسق متعلم، تكيفي، ومراعٍ للتكلفة، خلف نقطة نهاية واحدة.

يعتمد الخط البحثي على ورقتين من ICLR 2026:

  • Trinity: "منسق نموذج لغة كبير متطور" (arXiv:2512.04695)
  • Conductor: "تعلم تنسيق الوكلاء في اللغة الطبيعية" (arXiv:2512.04388)

لكن لا تخلط بين تفاصيل البحث والمنتج النهائي:

  • Trinity أقل من 20 ألف معلمة ويستخدم تطوراً خالياً من المشتقات.
  • Conductor نموذج 7 مليارات معلمة مدرب بالتعلم المعزز.
  • الإصدار الرسمي من Fugu لا يعلن عدد معلمات المنتج.
  • تطبيق تفاصيل 7 مليارات مباشرة على Fugu نفسه هو استنتاج خارجي، لا حقيقة معلنة.

الفارق العملي بين Fugu والأدوات الأخرى:

النوع ماذا يفعل؟
OpenRouter / Martian يختار نموذجاً واحداً ويرسل الطلب إليه
Swarm / AutoGen / LangGraph يعطيك إطاراً لتبني المنسق بنفسك
Fugu يدرب المنسق ويخفيه خلف استدعاء API واحد

كيف تختبر Fugu في سير عملك؟

Fugu يكشف نقطة نهاية واحدة متوافقة مع OpenAI. عملياً، يمكنك استخدام عميل OpenAI موجود وتغيير base_url ومفتاح API فقط.

ملاحظة: عنوان URL الأساسي غير منشور على صفحة عامة اعتباراً من 22 يونيو 2026. انسخه من لوحة تحكم Sakana على console.sakana.ai.

مثال Python:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_SAKANA_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",  # انسخه من console.sakana.ai
)

response = client.chat.completions.create(
    model="fugu-ultra",  # تحقق من المعرّف الدقيق في لوحة التحكم
    messages=[
        {"role": "system", "content": "You are a careful code reviewer."},
        {"role": "user", "content": "Review this pull request for security issues."},
    ],
)

print(response.choices[0].message.content)
Enter fullscreen mode Exit fullscreen mode

لا ترمز معرف النموذج بشكل نهائي قبل التأكد منه من لوحة التحكم. السلاسل المبلّغ عنها هي:

fugu
fugu-ultra
Enter fullscreen mode Exit fullscreen mode

وقد توجد صيغ مؤرخة.

اختبار Fugu باستخدام Apidog

بما أن Fugu يتحدث بصيغة Chat Completions المتوافقة مع OpenAI، يمكنك اختباره مثل أي نقطة نهاية نموذج أخرى. راجع أيضاً مرجع OpenAI Chat API.

في Apidog، يمكنك إعداد اختبار عملي كالتالي:

  1. أنشئ طلب API جديداً.
  2. استخدم عنوان base_url من لوحة تحكم Sakana.
  3. أضف ترويسة المصادقة بمفتاح Sakana.
  4. اضبط model على fugu-ultra.
  5. احفظ الطلب كحالة اختبار قابلة لإعادة الاستخدام.
  6. أنشئ طلبات مماثلة لـ Fable 5 أو Opus 4.8.
  7. شغّل نفس المطالبات وقارن النتائج جنباً إلى جنب.

مثال جسم الطلب:

{
  "model": "fugu-ultra",
  "messages": [
    {
      "role": "system",
      "content": "You are a careful security reviewer."
    },
    {
      "role": "user",
      "content": "Review this API design for authentication and authorization issues."
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode

بهذه الطريقة لا تعتمد على جدول تسويقي. أنت تقيس التكافؤ باستخدام مطالباتك وبياناتك الفعلية. يمكنك تنزيل Apidog لإعداد المقارنة.

نقطة مهمة لفرق الامتثال

تقول Sakana إن وكلاء Fugu قابلون للتبديل، ويمكن استبعاد وكلاء محددين من المجمع لأسباب تتعلق بالبيانات أو الامتثال. كما تقول إن Fugu يوجه ديناميكياً حول قيود المزود.

إذا كنت تعمل في بيئة منظمة:

  • اختبر مسار استبعاد المزودين.
  • راقب تتبع الاستجابة إن كان متاحاً.
  • تأكد من أن المزودين المستبعدين لا يظهرون في أي نتيجة.
  • لا تعتمد على الافتراض؛ ابنِ اختباراً آلياً لهذا السيناريو.

القرار العملي

هناك حالة قوية لصالح Fugu:

  • نقطة نهاية واحدة متوافقة مع OpenAI
  • منسق مدرب بدلاً من منطق توجيه يدوي
  • دعم بحثي واضح
  • أداء جيد في مهام منظمة وقابلة للتحقق
  • فائدة محتملة في مراجعة الكود، البحث، والأمن السيبراني

لكن هناك أيضاً أسباب للحذر:

  • ادعاء التكافؤ هو مع Mythos Preview الأقدم، لا Mythos 5.
  • ادعاء التفوق منفصل ويخص تطبيقات محددة.
  • Fugu قد يحقق نتائجه عبر استدعاء نفس النماذج التي يُقارن بها.
  • التسعير التفصيلي غير مؤكد بالكامل.
  • التنسيق كفكرة ليس جديداً؛ الجديد هو تغليفه كمنتج ونقطة API واحدة.

أفضل طريقة للتقييم ليست الانبهار ولا التجاهل. اختبر Fugu Ultra مقابل Fable 5 وOpus 4.8 في مهامك الفعلية، ثم قِس:

  • جودة الإجابة
  • زمن الاستجابة
  • التكلفة
  • قابلية التتبع
  • الامتثال
  • عدد مرات الحاجة إلى إعادة المحاولة
  • هل تضيف طبقة التنسيق قيمة كافية لتبرير التكلفة؟

الأسئلة الشائعة

هل يتفوق Fugu Ultra على Fable 5؟

لا. Sakana لا تدعي ذلك. ادعاؤها هو أن Fugu Ultra يقف جنباً إلى جنب مع Fable 5 وMythos Preview، أي تكافؤ لا تفوق. وبما أن Fugu منسق يمكنه استدعاء نماذج رائدة، فإن أي نتيجة قوية يجب قراءتها كأداء للنظام، لا كنموذج فردي أقوى. راجع Fable 5 vs Mythos 5.

ماذا تقصد Sakana عندما تقول إن Fugu يتفوق على Opus 4.8؟

هذا ادعاء منفصل ومحدود بتطبيقات معينة مثل AutoResearch، الشطرنج بضربة واحدة، والتنبؤ بالسلاسل الزمنية المالية. قد يحقق Fugu هذه النتائج عبر استدعاء Opus داخل حلقته الخاصة، لذلك هو فوز للنظام، لا فوز لنموذج فردي على Opus.

لماذا تقارن Sakana مع Mythos Preview وليس Mythos 5؟

Mythos Preview هو النموذج الرائد لشهر أبريل 2026، بينما Mythos 5 هو الإصدار الحالي المتاح بشكل عام. استخدام Preview قد يجعل الاختبار أكثر قابلية للتكرار، لكنه يعني أن ادعاء التكافؤ لا يُقاس مقابل السقف الحالي. اقرأ المزيد في شرح نموذج فئة Mythos.

هل Fugu نموذج فردي أم مجموعة نماذج؟

Fugu هو منسق يستدعي عدة نماذج LLM، بما في ذلك نسخاً من نفسه، ويقدم النظام كله كنموذج واحد خلف API متوافقة مع OpenAI. Fable 5 وMythos نموذجان فرديان من Anthropic.

كيف أختبر Fugu مقابل Fable 5 بنفسي؟

استخدم عميل OpenAI، غيّر base_url إلى عنوان Sakana من لوحة التحكم، واضبط model على fugu-ultra. ثم شغّل نفس المطالبات مقابل Fable 5 أو Opus 4.8. في Apidog، احفظ كل نموذج كطلب منفصل وشغّل المقارنة جنباً إلى جنب.

كم تكلفة Fugu مقارنة بـ Fable 5؟

هيكل التسعير مؤكد: اشتراكات + دفع حسب الاستخدام. لكن أرقام Fugu التفصيلية غير مؤكدة بالكامل اعتباراً من 22 يونيو 2026، لذلك تحقق منها في لوحة التحكم قبل وضع الميزانية. للمرجعية، تُدرج Anthropic Fable 5 بسعر 10 دولارات لكل مليون رمز إدخال و50 دولاراً لكل مليون رمز إخراج. تتبع مقالة معايير Sakana Fugu التفاصيل عند تأكيدها.

Top comments (0)