Sakana Fugu ist ein Mehragenten-Orchestrierungssystem von Sakana AI: Für Ihren Code wirkt es wie ein einzelnes Grundmodell hinter einer OpenAI-kompatiblen API, intern koordiniert es jedoch dynamisch andere LLMs, inklusive möglicher rekursiver Kopien seiner selbst. Sakana kündigte Fugu am 22. Juni 2026 unter „Ein Modell, um sie alle zu befehligen“ an; Details stehen auf der offiziellen Veröffentlichungsseite. Wenn Sie bereits Modelle wie Claude Fable 5 einordnen, ist Fugu anders zu lesen: Es ist ein Dirigent, kein Solist.
Der Name passt zum Design. Fugu ist der japanische Kugelfisch: nützlich und beeindruckend, aber nur mit präziser Zubereitung. Genau so sollten Sie Fugu technisch betrachten. Der Mehrwert entsteht nicht nur aus Modellleistung, sondern aus der Art, wie Fugu andere Modelle auswählt, beauftragt und deren Ergebnisse zusammenführt.
Das Wichtigste in Kürze
- Was es ist: Ein trainiertes „Dirigenten“-LLM, das ein Team von Spitzenmodellen hinter einem einzigen Endpunkt orchestriert.
-
Varianten:
fugufür ausgewogene Latenz und Qualität,fugu-ultrafür maximale Antwortqualität. -
API-Argument: OpenAI-kompatibel. Bestehende OpenAI-Clients können mit neuer
base_urlund neuem API-Key weiterverwendet werden. - Wichtiger Vorbehalt: Fugu kann Modelle anderer Anbieter aufrufen. Benchmarks sind daher „Modell-von-Modellen“-Ergebnisse, keine reinen Ein-Modell-Siege.
- Zugang: Produktseite und console.sakana.ai hinter Google-/E-Mail-Login.
Was Sakana Fugu tatsächlich ist
Bei klassischen Grundmodellen senden Sie eine Eingabeaufforderung, das Modell erzeugt Tokens, und Sie erhalten eine Antwort. Fugu fügt eine Orchestrierungsebene hinzu.
Wenn eine Anfrage eingeht, entscheidet Fugu, ob es selbst antwortet oder ein Team anderer Modelle zusammenstellt. Es kann Unteraufgaben verteilen, Nachrichten zwischen Agenten weiterleiten und die Ergebnisse zu einer einzigen Antwort synthetisieren. Laut Sakana können auch rekursive Instanzen von Fugu Teil dieses Teams sein.
Für Ihre Anwendung sieht Fugu damit wie ein einzelnes Modell aus. Architektonisch ist es aber ein Modell-von-Modellen. Diese Unterscheidung ist wichtig, sobald Sie Latenz, Kosten, Compliance oder Benchmark-Ergebnisse bewerten.
Das Branding folgt Sakanas Fisch-Metapher: „Sakana“ bedeutet auf Japanisch „Fisch“, und das Unternehmen positioniert seine Forschung rund um Schwarmintelligenz. Fugu ist das Kugelfisch-Mitglied dieses Schwarms.
Die zwei Varianten: Fugu und Fugu Ultra
Sakana liefert zwei Varianten über dieselbe API aus.
Fugu
Fugu ist die ausgewogene Variante mit niedrigerer Latenz. Sie ist für Alltagsaufgaben gedacht, bei denen Antwortzeit relevant ist:
- Coding-Assistenten
- Code Reviews
- Chatbots
- interaktive Entwickler-Tools
- schnelle technische Analysen
In der Beta wurde diese Variante teils als „Fugu Mini“ bezeichnet. Für neue Implementierungen sollten Sie mit fugu planen und den exakten Modellnamen in der Konsole prüfen.
Fugu Ultra
Fugu Ultra ist auf maximale Antwortqualität ausgelegt. Diese Variante passt eher zu Aufgaben, die mehr Tiefe, Recherche oder Verifikation benötigen:
- KI-Forschung
- Reproduktion von Paper-Ergebnissen
- Cybersicherheitsanalyse
- Literatur- oder Patentrecherche
- komplexe technische Entscheidungsfindung
Der Trade-off ist typisch: mehr Qualität und Orchestrierungstiefe, aber potenziell höhere Latenz und Kosten.
Für einen tieferen Vergleich siehe auch Fugu Ultra vs. Fable 5 vs. Mythos.
Spezifikationstabelle
| Attribut | Detail |
|---|---|
| Anbieter | Sakana AI |
| Veröffentlicht | 22. Juni 2026 |
| Typ | Mehragenten-Orchestrierungssystem, ausgeliefert als ein Grundmodell |
| Varianten | Fugu, Fugu Ultra |
| Alter Beta-Name | „Fugu Mini“ für die kleine Variante |
| API | OpenAI-kompatibler Endpunkt |
| Modell-ID-Strings |
fugu, fugu-ultra laut Berichten; in der Konsole verifizieren |
| Basis-URL | Nicht öffentlich veröffentlicht; aus console.sakana.ai kopieren |
| Zugang | Produktseite + console.sakana.ai mit Google-/E-Mail-Login |
| Preisstruktur | Abonnementstufen + Pay-as-you-go für intensivere oder Unternehmensnutzung |
| Forschungslinie | Trinity, arXiv:2512.04695; Conductor, arXiv:2512.04388; beide ICLR 2026 |
Wie die Orchestrierung funktioniert
Der Kern von Fugu ist kein statischer Router, sondern ein gelernter Dirigent.
Ein klassischer Router wählt ein Modell aus und leitet die Anfrage weiter. Ein Agenten-Framework wie Swarm, AutoGen oder LangGraph gibt Ihnen Bausteine, aber Sie schreiben die Koordinationslogik selbst.
Fugu sitzt dazwischen: Die Koordination ist selbst Teil des trainierten Systems. Es lernt, wann delegiert werden soll, wie Arbeit aufgeteilt wird, welche Agenten welche Teilaufgaben erhalten und wie die Ergebnisse wieder zusammengeführt werden.
Praktisch bedeutet das:
Anfrage senden
Sie senden eine normale Chat-Completions-Anfrage.Fugu plant die Arbeit
Fugu entscheidet, ob eine direkte Antwort reicht oder ob mehrere Agenten benötigt werden.Agenten bearbeiten Teilaufgaben
Die Arbeit kann auf andere Modelle oder rekursive Fugu-Instanzen verteilt werden.Fugu synthetisiert das Ergebnis
Die Teilergebnisse werden in eine finale Antwort überführt.
Laut Sakana übernimmt Fugu dabei drei Kernfunktionen:
- Delegation: Auswahl passender Agenten oder rekursiver Kopien.
- Kommunikation: Steuerung der Nachrichten zwischen Agenten.
- Synthese: Zusammenführung der Resultate zu einer kohärenten Antwort.
Zwei Governance-Aspekte sind besonders relevant:
- Austauschbare Agenten: Bestimmte Agenten können aus Daten- oder Compliance-Gründen ausgeschlossen werden.
- Umgehen von Beschränkungen: Wenn ein Anbieter oder Modell nicht verfügbar oder nicht zulässig ist, kann Fugu laut Sakana einen anderen Agenten wählen.
Wenn Sie die Einzelmodell-Ebene vergleichen möchten, siehe den Mythos-Klasse-Modellerklärer.
Die wichtigste Einordnung: Orchestrator, kein einzelnes Modell
Fugu sollte nicht wie ein normales Ein-Modell-System bewertet werden.
Fugu ist ein Orchestrator, der Spitzenmodelle anderer Anbieter aufrufen kann, einschließlich rekursiver Aufrufe seiner selbst. Wenn Sie ein Fugu-Benchmark-Ergebnis sehen, kann dieses Ergebnis durch ein Team entstanden sein. Es ist deshalb ein „Modell-von-Modellen“-Resultat, kein reiner Ein-Modell-Sieg.
Das betrifft zwei Arten von Aussagen.
Erstens sagt Sakana, dass Fugu Ultra bei Benchmarks in Engineering, Wissenschaft und Reasoning „Schulter an Schulter“ mit führenden Modellen wie Fable 5 und Mythos Preview steht. Lesen Sie das als Gleichrangigkeitsanspruch, nicht als Beweis, dass ein einzelnes Fugu-Modell isoliert überlegen ist.
Zweitens berichtet Sakana, dass Fugu Gemini 3.1 Pro, Opus 4.8 und GPT 5.5 bei bestimmten Anwendungen übertrifft, darunter AutoResearch, Rubik's Cube, mechanisches Design, japanische Handschriftenanalyse, One-Shot-Schach und Finanzzeitreihenprognose.
Auch hier gilt: Ein orchestriertes Team kann einen Solisten schlagen und trotzdem teilweise von diesem Solisten abhängig sein. Das ist keine Kritik an Fugu. Es ist nur die korrekte technische Einordnung.
Für Kontext zu Fable 5 siehe den Claude Fable 5-Erklärer.
Forschungslinie: Trinity und Conductor
Fugu baut auf einer Forschungslinie zu trainierter Orchestrierung auf. Zwei ICLR-2026-Arbeiten sind dabei zentral.
Trinity: Ein entwickelter LLM-Koordinator
arXiv:2512.04695 beschreibt einen sehr kleinen Koordinator mit unter 20.000 Parametern, der per ableitungsfreier Evolution optimiert wurde. Er weist Rollen wie Denker, Arbeiter und Prüfer zu.
Conductor: Lernen, Agenten in natürlicher Sprache zu orchestrieren
arXiv:2512.04388 beschreibt ein 7B-Modell, das per Reinforcement Learning trainiert wurde und Kommunikationsstrukturen zwischen Agenten lernt. Es behauptet, Mixture-of-Agents zu geringeren Kosten zu übertreffen.
Wichtig: Diese Arbeiten verwenden unterschiedliche Methoden und Größenordnungen. Sakana hat keine Parameterzahl für das ausgelieferte Fugu-Produkt veröffentlicht. Daher sollten Sie keine 7B-, Qwen2.5- oder GRPO-Spezifikationen als offizielle Fugu-Spezifikation behandeln.
Die eng gefasste technische Neuheit von Fugu ist nicht „mehrere Modelle arbeiten zusammen“ an sich. Das zeigte Mixture-of-Agents bereits. Die Neuheit liegt eher in einer gelernten, adaptiven und kostenselektiven Topologie, die als einzelner API-Endpunkt ausgeliefert wird.
Was frühe Benutzer berichten
Sakana nennt zwei frühe Erfahrungsberichte.
Ein Softwareingenieur nutzte Fugu Ultra für Code Reviews und sagte, es habe „mehr als zwanzig“ Probleme in Fällen gefunden, in denen andere Tools „etwa drei“ meldeten. Ein Sicherheitsingenieur berichtete, dass eine gezielte Anweisung zu einer vollständigen End-to-End-Bewertung führte, inklusive Aufklärung, XSS- und SQLi-Sondierung sowie Authentifizierungsprüfung innerhalb des definierten Scopes.
Behandeln Sie diese Aussagen als Anbieter-Anekdoten, nicht als unabhängige Benchmarks. Sie zeigen aber, welche Workloads gut zu Fugu passen:
- Aufgaben mit mehreren parallelen Teilproblemen
- Aufgaben mit Review- oder Verifikationsschritt
- Sicherheits- und Forschungsworkflows
- komplexe Codeanalysen
- mehrstufige technische Untersuchungen
Für Sakanas anderes Modell in dieser Reihe siehe den Mirofish-Erklärer.
Die Fugu API verwenden
Fugu bietet einen OpenAI-kompatiblen Endpunkt. Wenn Sie bereits den OpenAI-Python-Client nutzen, müssen Sie typischerweise nur drei Dinge ändern:
- API-Key
base_url- Modell-ID
Die Anfrageform bleibt am bekannten Chat-Completions-Format aus den OpenAI API-Dokumenten orientiert.
Wichtiger Vorbehalt: Am 22.06.2026 war die Basis-URL nicht öffentlich dokumentiert. Erraten Sie sie nicht. Kopieren Sie die echte Basis-URL aus Ihrem Dashboard unter console.sakana.ai.
Beispiel: Fugu mit dem OpenAI-Python-Client
from openai import OpenAI
client = OpenAI(
api_key="IHR_FUGU_API_SCHLUESSEL",
base_url="<IHRE_FUGU_BASIS_URL_AUS_DER_KONSOLE>",
)
response = client.chat.completions.create(
model="fugu",
messages=[
{
"role": "system",
"content": "Sie sind ein präziser Programmierassistent."
},
{
"role": "user",
"content": "Überprüfen Sie diese Funktion auf Off-by-one-Fehler."
},
],
)
print(response.choices[0].message.content)
Zu Fugu Ultra wechseln
Für Fugu Ultra ändern Sie nur die Modell-ID:
response = client.chat.completions.create(
model="fugu-ultra",
messages=[
{
"role": "user",
"content": "Reproduzieren Sie das Hauptergebnis aus diesem Paper."
},
],
)
print(response.choices[0].message.content)
Die Strings fugu und fugu-ultra stammen aus Berichten. Verifizieren Sie die exakten Modell-IDs in der Sakana-Konsole, bevor Sie sie in produktiven Code übernehmen.
Eine vollständige Schritt-für-Schritt-Anleitung finden Sie im Leitfaden zur Verwendung der Sakana Fugu API.
Fugu in einem Apidog-Workflow testen
Da Fugu das OpenAI-Chat-Completions-Format spricht, können Sie es wie jeden anderen LLM-Endpunkt in Apidog testen.
Empfohlener Ablauf:
Umgebung anlegen
Speichern Sie die Sakana-Basis-URL aus der Konsole als Umgebungsvariable, zum BeispielFUGU_BASE_URL.Authorization setzen
Verwenden Sie Ihren Fugu-Key als Bearer Token.Chat-Completions-Request erstellen
Nutzen Sie den von Sakana bereitgestellten Chat-Completions-Pfad.Modell-ID variieren
Testen Sie dieselbe Anfrage einmal mitfuguund einmal mitfugu-ultra.Latenz und Token-Nutzung vergleichen
Speichern Sie die Requests als wiederverwendbare Testfälle und vergleichen Sie reale Antwortzeiten.
Gerade bei Fugu ist diese Messung wichtig. Da es sich um einen Orchestrator handelt, können Latenz und Kosten stärker schwanken als bei einem einzelnen Modell. Die tatsächlichen Zahlen hängen davon ab, wie viele Agenten Fugu für eine Anfrage einsetzt.
Starten Sie mit einer neuen Anfrage an Ihre Konsolen-Basis-URL oder laden Sie Apidog herunter, um den Workflow lokal aufzusetzen.
Häufig gestellte Fragen
Ist Sakana Fugu ein einzelnes Modell oder viele Modelle?
Aus Sicht Ihres Codes ist Fugu ein Modell hinter einer API. Intern ist es ein trainierter Dirigent, der andere Modelle aufrufen und deren Ergebnisse synthetisieren kann. Deshalb sollten Sie Fugu-Benchmarks als „Modell-von-Modellen“-Ergebnisse einordnen. Für den Einzelmodell-Vergleich siehe den Mythos-Klasse-Modellerklärer.
Was ist der Unterschied zwischen Fugu und Fugu Ultra?
fugu ist die ausgewogene Variante für alltägliche Aufgaben wie Coding, Chatbots und interaktive Dienste. fugu-ultra priorisiert Antwortqualität und eignet sich eher für Forschung, Sicherheitsanalyse und tiefere technische Untersuchungen. Beide laufen über denselben API-Zugang; Sie wählen per Modell-ID.
Übertrifft Fugu wirklich Opus 4.8 und GPT 5.5?
Laut Sakana übertrifft Fugu diese Modelle bei bestimmten Anwendungen. Technisch sollten Sie das als Team-Ergebnis lesen: Fugu kann Modelle orchestrieren und dadurch bessere Endergebnisse erzeugen, ohne dass seine eigenen Gewichte isoliert jedes einzelne Modell schlagen müssen.
Wie rufe ich die Fugu API auf?
Verwenden Sie einen OpenAI-kompatiblen Client, setzen Sie Ihren Fugu-API-Key und tragen Sie die Sakana-Basis-URL aus console.sakana.ai ein. Danach senden Sie eine normale Chat-Completions-Anfrage. Der Sakana Fugu API-Leitfaden zeigt ein vollständiges Beispiel.
Ist Fugu derzeit für jeden verfügbar?
Der Zugang erfolgt über die Produktseite und console.sakana.ai mit Google- oder E-Mail-Login. Die Beta lief ab Ende April 2026 mit etwa 500 Nutzern. Ob Self-Service-GA offen ist und ob regionale Einschränkungen gelten, sollten Sie live in der Konsole prüfen.
Wie unterscheidet sich Fugu von einem Router oder Agenten-Framework?
Ein Router wählt ein Modell aus und leitet die Anfrage weiter. Ein Agenten-Framework gibt Ihnen Bausteine, aber Sie schreiben die Koordination. Fugu trainiert den Koordinator selbst: Delegation, Kommunikation und Synthese werden durch ein gelerntes Modell gesteuert.
Fazit
Fugu ist eine Wette darauf, dass Fortschritt nicht nur aus größeren Einzelmodellen entsteht, sondern aus besserer Zusammenarbeit zwischen Modellen. Für Entwickler ist der Einstieg praktisch, weil die API OpenAI-kompatibel ist. Der wichtigste Test bleibt aber Ihr eigener Workload: Senden Sie reale Anfragen, messen Sie Latenz und Kosten, vergleichen Sie fugu mit fugu-ultra und stellen Sie die Ergebnisse einzelnen Modellen gegenüber.
Richten Sie Ihren ersten Fugu-Aufruf in Apidog ein und lassen Sie Ihre eigenen Messdaten entscheiden.





Top comments (0)