Yusuf Khalidd

Posted on Jun 22 • Originally published at apidog.com

فوجو ألترا ضد فابل 5 ضد ميثوس: مقارنة ساكانا أوركستريتور بفرونتير

Fugu Ultra هو الإصدار الأبرز من Fugu من Sakana AI. تقدمه Sakana كنظام يصل إلى مستوى النماذج الرائدة، لا كنموذج يتفوق عليها. وفقاً لـ Sakana، فإن Fugu Ultra "يقف جنباً إلى جنب مع النماذج الرائدة مثل Fable 5 وMythos Preview" في معايير الهندسة والعلوم والاستدلال. النقطة العملية المهمة: Fugu ليس نموذجاً فردياً مثل نماذج Anthropic، بل منسق يستدعي نماذج بائعين آخرين خلف واجهة API واحدة. التفاصيل الرسمية متاحة في صفحة إصدار Sakana Fugu، ويمكنك قراءة تحليل أوسع في ما هو Sakana Fugu.

جرّب Apidog اليوم

ما الذي تقارنه فعلياً؟

Fugu هو نظام تنسيق متعدد الوكلاء يُقدَّم كنموذج أساسي واحد خلف واجهة API واحدة متوافقة مع OpenAI. تصفه Sakana بأنه نموذج لغوي مدرب على:

التفويض بين الوكلاء
تواصل الوكلاء
تجميع العمل
اختيار النموذج المناسب لكل طلب

أي أن Fugu قد يجيب مباشرة، أو يكوّن فريقاً من نماذج LLM متعددة، بما في ذلك نسخ متكررة من نفسه. لذلك عنوان الإصدار: "نموذج واحد لقيادة الجميع".

أما Fable 5 وMythos فهما مختلفان: كلاهما نموذج فردي من Anthropic. Fable 5 هو أقوى نموذج Anthropic متاح بشكل عام، وهو نموذج من "فئة Mythos" صُمم ليكون آمناً للاستخدام العام، ويقع فوق Opus 4.8. أما Mythos Preview، الصادر في 7 أبريل 2026، فهو النموذج الرائد الذي وصفته Anthropic بأنه خطير للغاية بحيث لا يمكن إصداره.

تفصيل مهم: Sakana قارنت Fugu Ultra مع Mythos Preview الأقدم، وليس Mythos 5 الحالي. نغطي هذا الجانب في Fable 5 vs Mythos 5 وشرح نموذج فئة Mythos.

الخلاصة: أنت لا تقارن نموذجاً واحداً بنموذج واحد. أنت تقارن منسقاً متعدد النماذج بنماذج فردية.

Fugu وFugu Ultra باختصار

يتوفر Fugu في إصدارين عبر نقطة نهاية واحدة:

الإصدار	الاستخدام المناسب
`fugu`	مهام يومية، برمجة، مراجعة كود، روبوتات دردشة، خدمات تفاعلية، وزمن استجابة أقل
`fugu-ultra`	جودة أعلى للإجابات، أبحاث الذكاء الاصطناعي، إعادة إنتاج الأوراق البحثية، الأمن السيبراني، البحث في الأدبيات وبراءات الاختراع

أطلقت النسخة التجريبية وبعض التغطيات الإعلامية على الإصدار الأصغر اسم "Fugu Mini"، لكن صفحة الإصدار تستخدم اسمي Fugu وFugu Ultra. استخدم هذه الأسماء عند بناء التكامل.

النقطة الحاسمة: منسق مقابل نموذج فردي

لا تتعامل مع نتائج Fugu كما لو كانت نتائج نموذج فردي.

Fugu هو منسق. عندما ينتج إجابة قوية، فقد يكون قد فعل ذلك عبر استدعاء نموذج رائد آخر مثل Opus 4.8 أو Gemini، ثم أضاف طبقة تخطيط أو تحقق أو توليف فوق النتيجة.

هذا مهم عند قراءة أي نتيجة مثل:

Fugu يتفوق على Opus 4.8 في مهمة معينة.

قد يكون Fugu وصل إلى تلك النتيجة باستخدام Opus 4.8 داخل الحلقة. هذا لا يجعل النتيجة غير مفيدة، لكنه يجعلها فوزاً للنظام ككل، لا دليلاً على أن "أوزان" Fugu وحدها أقوى من Opus.

أما Fable 5 وMythos فهما نموذجان فرديان يجيبان من خلال أوزانهما الخاصة.

لذلك القراءة الدقيقة هي:

نظام منسق وصل إلى جودة تضاهي النماذج الرائدة، جزئياً عبر التوجيه إلى نماذج رائدة.

وليست:

Fugu يتفوق على Fable 5.

للتفاصيل الخاصة بالأرقام، راجع معايير Sakana Fugu.

المستوى الأول: التكافؤ مع Fable 5 وMythos Preview

ادعاء Sakana الأساسي هو التكافؤ. تقول Sakana إن Fugu Ultra يقف جنباً إلى جنب مع Fable 5 وMythos Preview عبر معايير الهندسة والعلوم والاستدلال.

هذا يعني:

لا يوجد ادعاء رسمي بأن Fugu Ultra يتفوق على Fable 5.
المقارنة مع Mythos Preview، لا Mythos 5.
التكافؤ هنا على مستوى النظام، لا بالضرورة على مستوى نموذج أساسي واحد.

هناك نقطتان عمليتان يجب الانتباه لهما عند تقييم هذا الادعاء.

1. المقارنة مع Mythos Preview وليست Mythos 5

Mythos Preview هو نموذج أبريل 2026، وليس النموذج الحالي Mythos 5. وفقاً لأسعار Anthropic بتاريخ 9 يونيو 2026:

النموذج	إدخال لكل مليون رمز	إخراج لكل مليون رمز
Fable 5	10 دولارات	50 دولاراً
Mythos 5	10 دولارات	50 دولاراً
Mythos Preview	25 دولاراً	125 دولاراً

اختيار نموذج Preview قد يكون مناسباً لمقارنة قابلة للتكرار، لكنه لا يعني أن Fugu Ultra قيس مقابل السقف الحالي.

2. الآلية أهم من الرقم الخام

إذا وصل Fugu Ultra إلى مستوى Fable 5 عبر تنسيق فريق من النماذج، فهذا تكافؤ حقيقي على مستوى النظام. لكنه لا يثبت أن نموذجاً داخلياً واحداً في Fugu يساوي Fable 5 وحده.

لرؤية موقع Fable 5 مقابل Opus 4.8، راجع Claude Fable 5 vs Opus 4.8.

المستوى الثاني: أين تدعي Sakana أن Fugu يتفوق؟

هذا ادعاء مختلف عن التكافؤ مع Fable 5 وMythos Preview.

وفقاً لـ Sakana، يتفوق Fugu باستمرار على هذه النماذج في تطبيقات محددة:

Gemini 3.1 Pro High
Opus 4.8 Max
GPT 5.5 Ultra High

لكن نطاق الادعاء ضيق. التطبيقات المذكورة تشمل:

AutoResearch
مكعب روبيك
التصميم الميكانيكي
تحليل الخط اليدوي الياباني
الشطرنج بضربة واحدة
التنبؤ بالسلاسل الزمنية المالية

هذه ليست انتصارات عامة على كل المعايير. إنها نتائج على مستوى التطبيق.

وهذا منطقي تقنياً: المهام المنظمة متعددة الخطوات تناسب منسقاً يستطيع التخطيط، التفويض، التحقق، وإعادة المحاولة. هنا تحديداً تضيف طبقة التنسيق قيمة.

الصياغة الأدق:

تضيف طبقة التنسيق في Fugu قيمة قابلة للقياس في المهام المنظمة والقابلة للتحقق، وأحياناً تكفي للتفوق على نموذج رائد واحد في مهمة محددة.

جدول مقارنة سريع

اقرأ صف "نوع النظام" أولاً. هذا هو الفرق الأساسي.

البُعد	Fugu / Fugu Ultra	Fable 5	Mythos Preview / Mythos 5
نوع النظام	منسق يستدعي نماذج LLM متعددة، بما في ذلك نفسه	نموذج Anthropic فردي	نموذج Anthropic فردي
البائع	Sakana AI	Anthropic	Anthropic
ادعاء Sakana	تكافؤ مع Fable 5 وMythos Preview	نظير تكافؤ مسمى	Mythos Preview هو النظير، وليس Mythos 5
ادعاء التفوق المنفصل	مقابل Gemini 3.1 Pro وOpus 4.8 وGPT 5.5 في تطبيقات محددة	ليس هدف التفوق	ليس هدف التفوق
التسعير	مستويات مبلّغ عنها + دفع حسب الاستخدام، غير مؤكدة بالكامل	10 دولارات إدخال / 50 دولاراً إخراج لكل مليون رمز	Preview: 25 / 125 دولاراً، Mythos 5: 10 / 50 دولاراً
API	نقطة نهاية واحدة متوافقة مع OpenAI	Anthropic API	Anthropic API
القوة	مهام متعددة الخطوات، حوكمة، توجيه، تحقق	جودة عامة عالية وآمنة للاستخدام العام	أعلى سقف رائد

أرقام Fugu السعرية مبلّغ عنها وليست مؤكدة من صفحة الإصدار نفسها. تعامل معها كأرقام تحتاج إلى تحقق مباشر. للمزيد حول درجات Fable 5، راجع معايير Claude Fable 5.

التسعير: ما الذي يمكنك الاعتماد عليه؟

أكدت Sakana بنية التسعير التالية:

مستويات اشتراك للاستخدام اليومي
خطة دفع حسب الاستخدام للأحمال الأكبر والمؤسسية

لكن الأرقام التفصيلية غير مؤكدة بالكامل اعتباراً من 22 يونيو 2026. الأرقام المتداولة تأتي من مصادر ثانوية أو صفحات تعتمد على JavaScript، وليست من صفحة الإصدار الرسمية.

الأرقام المبلّغ عنها:

اشتراكات شهرية تقريبية: 20 / 100 / 200 دولار
عرض إطلاق: شهر ثانٍ مجاني عند الاشتراك قبل نهاية يوليو 2026
دفع حسب الاستخدام:
- 5 دولارات تقريباً لكل مليون رمز إدخال
- 30 دولاراً تقريباً لكل مليون رمز إخراج
- 0.50 دولار تقريباً للمخزن المؤقت لكل مليون رمز
- رسوم إضافية للسياق فوق 272 ألف رمز
الإصدار الأساسي fugu يقال إنه يُحاسب بتكلفة النموذج الأساسي الذي يستدعيه
لا يوجد مستوى مجاني مستقل مؤكد

لا تبنِ ميزانيتك على هذه الأرقام قبل تأكيدها في لوحة التحكم الخاصة بك.

الخلفية البحثية: ماذا يثبت Fugu وماذا لا يثبت؟

Sakana لم تخترع فكرة التنسيق بين النماذج. منهجية Mixture-of-Agents من Together AI، المنشورة في ICLR 2025، أظهرت بالفعل أن تنسيق عدة نماذج يمكن أن يتفوق على نموذج واحد.

ما يميز Fugu هو تقديم منسق متعلم، تكيفي، ومراعٍ للتكلفة، خلف نقطة نهاية واحدة.

يعتمد الخط البحثي على ورقتين من ICLR 2026:

Trinity: "منسق نموذج لغة كبير متطور" (arXiv:2512.04695)
Conductor: "تعلم تنسيق الوكلاء في اللغة الطبيعية" (arXiv:2512.04388)

لكن لا تخلط بين تفاصيل البحث والمنتج النهائي:

Trinity أقل من 20 ألف معلمة ويستخدم تطوراً خالياً من المشتقات.
Conductor نموذج 7 مليارات معلمة مدرب بالتعلم المعزز.
الإصدار الرسمي من Fugu لا يعلن عدد معلمات المنتج.
تطبيق تفاصيل 7 مليارات مباشرة على Fugu نفسه هو استنتاج خارجي، لا حقيقة معلنة.

الفارق العملي بين Fugu والأدوات الأخرى:

النوع	ماذا يفعل؟
OpenRouter / Martian	يختار نموذجاً واحداً ويرسل الطلب إليه
Swarm / AutoGen / LangGraph	يعطيك إطاراً لتبني المنسق بنفسك
Fugu	يدرب المنسق ويخفيه خلف استدعاء API واحد

كيف تختبر Fugu في سير عملك؟

Fugu يكشف نقطة نهاية واحدة متوافقة مع OpenAI. عملياً، يمكنك استخدام عميل OpenAI موجود وتغيير base_url ومفتاح API فقط.

ملاحظة: عنوان URL الأساسي غير منشور على صفحة عامة اعتباراً من 22 يونيو 2026. انسخه من لوحة تحكم Sakana على console.sakana.ai.

مثال Python:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_SAKANA_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",  # انسخه من console.sakana.ai
)

response = client.chat.completions.create(
    model="fugu-ultra",  # تحقق من المعرّف الدقيق في لوحة التحكم
    messages=[
        {"role": "system", "content": "You are a careful code reviewer."},
        {"role": "user", "content": "Review this pull request for security issues."},
    ],
)

print(response.choices[0].message.content)

لا ترمز معرف النموذج بشكل نهائي قبل التأكد منه من لوحة التحكم. السلاسل المبلّغ عنها هي:

fugu
fugu-ultra

وقد توجد صيغ مؤرخة.

اختبار Fugu باستخدام Apidog

بما أن Fugu يتحدث بصيغة Chat Completions المتوافقة مع OpenAI، يمكنك اختباره مثل أي نقطة نهاية نموذج أخرى. راجع أيضاً مرجع OpenAI Chat API.

في Apidog، يمكنك إعداد اختبار عملي كالتالي:

أنشئ طلب API جديداً.
استخدم عنوان base_url من لوحة تحكم Sakana.
أضف ترويسة المصادقة بمفتاح Sakana.
اضبط model على fugu-ultra.
احفظ الطلب كحالة اختبار قابلة لإعادة الاستخدام.
أنشئ طلبات مماثلة لـ Fable 5 أو Opus 4.8.
شغّل نفس المطالبات وقارن النتائج جنباً إلى جنب.

مثال جسم الطلب:

{
  "model": "fugu-ultra",
  "messages": [
    {
      "role": "system",
      "content": "You are a careful security reviewer."
    },
    {
      "role": "user",
      "content": "Review this API design for authentication and authorization issues."
    }
  ]
}

بهذه الطريقة لا تعتمد على جدول تسويقي. أنت تقيس التكافؤ باستخدام مطالباتك وبياناتك الفعلية. يمكنك تنزيل Apidog لإعداد المقارنة.

نقطة مهمة لفرق الامتثال

تقول Sakana إن وكلاء Fugu قابلون للتبديل، ويمكن استبعاد وكلاء محددين من المجمع لأسباب تتعلق بالبيانات أو الامتثال. كما تقول إن Fugu يوجه ديناميكياً حول قيود المزود.

إذا كنت تعمل في بيئة منظمة:

اختبر مسار استبعاد المزودين.
راقب تتبع الاستجابة إن كان متاحاً.
تأكد من أن المزودين المستبعدين لا يظهرون في أي نتيجة.
لا تعتمد على الافتراض؛ ابنِ اختباراً آلياً لهذا السيناريو.

القرار العملي

هناك حالة قوية لصالح Fugu:

نقطة نهاية واحدة متوافقة مع OpenAI
منسق مدرب بدلاً من منطق توجيه يدوي
دعم بحثي واضح
أداء جيد في مهام منظمة وقابلة للتحقق
فائدة محتملة في مراجعة الكود، البحث، والأمن السيبراني

لكن هناك أيضاً أسباب للحذر:

ادعاء التكافؤ هو مع Mythos Preview الأقدم، لا Mythos 5.
ادعاء التفوق منفصل ويخص تطبيقات محددة.
Fugu قد يحقق نتائجه عبر استدعاء نفس النماذج التي يُقارن بها.
التسعير التفصيلي غير مؤكد بالكامل.
التنسيق كفكرة ليس جديداً؛ الجديد هو تغليفه كمنتج ونقطة API واحدة.

أفضل طريقة للتقييم ليست الانبهار ولا التجاهل. اختبر Fugu Ultra مقابل Fable 5 وOpus 4.8 في مهامك الفعلية، ثم قِس:

جودة الإجابة
زمن الاستجابة
التكلفة
قابلية التتبع
الامتثال
عدد مرات الحاجة إلى إعادة المحاولة
هل تضيف طبقة التنسيق قيمة كافية لتبرير التكلفة؟

الأسئلة الشائعة

هل يتفوق Fugu Ultra على Fable 5؟

لا. Sakana لا تدعي ذلك. ادعاؤها هو أن Fugu Ultra يقف جنباً إلى جنب مع Fable 5 وMythos Preview، أي تكافؤ لا تفوق. وبما أن Fugu منسق يمكنه استدعاء نماذج رائدة، فإن أي نتيجة قوية يجب قراءتها كأداء للنظام، لا كنموذج فردي أقوى. راجع Fable 5 vs Mythos 5.

ماذا تقصد Sakana عندما تقول إن Fugu يتفوق على Opus 4.8؟

هذا ادعاء منفصل ومحدود بتطبيقات معينة مثل AutoResearch، الشطرنج بضربة واحدة، والتنبؤ بالسلاسل الزمنية المالية. قد يحقق Fugu هذه النتائج عبر استدعاء Opus داخل حلقته الخاصة، لذلك هو فوز للنظام، لا فوز لنموذج فردي على Opus.

لماذا تقارن Sakana مع Mythos Preview وليس Mythos 5؟

Mythos Preview هو النموذج الرائد لشهر أبريل 2026، بينما Mythos 5 هو الإصدار الحالي المتاح بشكل عام. استخدام Preview قد يجعل الاختبار أكثر قابلية للتكرار، لكنه يعني أن ادعاء التكافؤ لا يُقاس مقابل السقف الحالي. اقرأ المزيد في شرح نموذج فئة Mythos.

هل Fugu نموذج فردي أم مجموعة نماذج؟

Fugu هو منسق يستدعي عدة نماذج LLM، بما في ذلك نسخاً من نفسه، ويقدم النظام كله كنموذج واحد خلف API متوافقة مع OpenAI. Fable 5 وMythos نموذجان فرديان من Anthropic.

كيف أختبر Fugu مقابل Fable 5 بنفسي؟

استخدم عميل OpenAI، غيّر base_url إلى عنوان Sakana من لوحة التحكم، واضبط model على fugu-ultra. ثم شغّل نفس المطالبات مقابل Fable 5 أو Opus 4.8. في Apidog، احفظ كل نموذج كطلب منفصل وشغّل المقارنة جنباً إلى جنب.

كم تكلفة Fugu مقارنة بـ Fable 5؟

هيكل التسعير مؤكد: اشتراكات + دفع حسب الاستخدام. لكن أرقام Fugu التفصيلية غير مؤكدة بالكامل اعتباراً من 22 يونيو 2026، لذلك تحقق منها في لوحة التحكم قبل وضع الميزانية. للمرجعية، تُدرج Anthropic Fable 5 بسعر 10 دولارات لكل مليون رمز إدخال و50 دولاراً لكل مليون رمز إخراج. تتبع مقالة معايير Sakana Fugu التفاصيل عند تأكيدها.

DEV Community