Emre Demir

Posted on Jun 22 • Originally published at apidog.com

Sakana Fugu Preisgestaltung: Abonnement-Modelle, nutzungsbasierte Abrechnung und das Passthrough-Kostenmodell

Die Preisgestaltung von Sakana Fugu basiert auf zwei bestätigten Strukturen: Abonnement-Stufen für den täglichen Gebrauch und einem Pay-as-you-go-Plan für größere und Unternehmens-Workloads. Die neue Mechanik ist die Passthrough-Abrechnung: Mehrere Agenten können innerhalb einer Anfrage arbeiten, ohne dass automatisch pro Agent eine separate Gebühr gestapelt wird. Alle unten genannten Dollarbeträge stammen aus Sekundärquellen, weil Sakana auf der eigenen Release-Seite die Struktur beschreibt, aber keine konkreten Zahlen nennt. Wichtig: Fugu ist ein Orchestrierungssystem, das als einzelnes Modell präsentiert wird. Genau dadurch wird diese Abrechnungsmechanik möglich.

Testen Sie Apidog noch heute

Wie Fugu preislich strukturiert ist

Fugu wird nicht wie ein normales Chat-Modell bepreist. Es funktioniert als Dirigent: Ein trainiertes Sprachmodell entscheidet, ob es Ihre Anfrage direkt beantwortet oder ein Team von Arbeitsmodellen zusammenstellt, einschließlich rekursiver Instanzen seiner selbst. Diese Architektur beeinflusst direkt die Kosten.

Sakana bestätigt auf der Release-Seite zwei Kaufwege:

Abonnement-Stufen für tägliche Arbeit. Sie zahlen eine feste monatliche Gebühr und nutzen das Modell für Codierung, Code-Reviews, Chatbots und interaktive Dienste.

Pay-as-you-go (PAYG) für größere und Unternehmens-Workloads. Sie zahlen pro Token. Das passt besser zu Batch-Jobs, Forschungsdurchläufen und schwankendem Datenverkehr.

Sowohl die ausgewogene Variante „Fugu“ als auch die hochwertigere Variante „Fugu Ultra“ sind über einen OpenAI-kompatiblen Endpunkt erreichbar. Sie wählen die Variante über eine Modell-ID aus. Fugu entscheidet dann intern, wie viel Rechenleistung und welche Worker-Modelle eingesetzt werden.

Eine eigenständige kostenlose Stufe wurde nicht gemeldet. Am nächsten kommt eine Startaktion, die weiter unten beschrieben wird.

Wenn Sie die Wirtschaftlichkeit testen möchten, bevor Sie sich festlegen, richten Sie einen bestehenden OpenAI-Client auf Fugu und protokollieren Sie die Token-Nutzung pro Request. Apidog hilft dabei, Anfragen einzeln zu beobachten. Das ist bei Fugu wichtiger als bei einer Einzelmodell-API, weil ein einzelner Fugu-Aufruf intern in mehrere Modellaufrufe verzweigen kann.

Gemeldete Preise: vor der Budgetierung live überprüfen

Die folgenden Preise sind gemeldet, aber nicht direkt auf Sakana’s Release-Seite bestätigt. Behandeln Sie sie deshalb als Planungswerte und prüfen Sie die tatsächlichen Werte immer in Ihrer Konsole.

Gemeldete Abonnement-Stufen

Plan	Gemeldeter Monatspreis	Zielgruppe
Einstieg	gemeldet $20 / Monat	Einzelne Entwickler, leichte tägliche Nutzung
Mittel	gemeldet $100 / Monat	Teams, konstante Codierungs- und Review-Workloads
Top	gemeldet $200 / Monat	Power-User, interaktive Dienste mit hohem Volumen

Diese Stufen gelten Berichten zufolge sowohl für Fugu als auch für Fugu Ultra. Zusätzlich wird eine Startaktion erwähnt: ein kostenloser zweiter Monat, wenn Sie vor Ende Juli 2026 abonnieren. Prüfen Sie dieses Angebot direkt in der Konsole, bevor Sie es in Ihre Entscheidung einbeziehen, da Startangebote schnell geändert werden können und diese Aktion nicht auf der Release-Seite bestätigt ist.

Gemeldete Pay-as-you-go-Tarife

Token-Typ	Gemeldeter Tarif pro 1 Mio. Tokens	Gemeldeter Aufschlag über 272K Kontext
Eingabe	gemeldet $5	gemeldet $10
Ausgabe	gemeldet $30	gemeldet $45
Gecachter Input	gemeldet $0.50	gemeldet $1.00

Der Aufschlag für langen Kontext ist der wichtigste Teil für die Budgetierung. Anfragen mit mehr als etwa 272K Tokens kosten Berichten zufolge deutlich mehr pro Million Tokens. Orchestrierungs-Prompts können schnell wachsen, weil der Dirigent Kontext zwischen Worker-Agenten weitergibt. Ein Fugu-Ultra-Lauf für Forschung oder komplexe Analyse kann deshalb früher als erwartet in diesen Bereich geraten.

Wenn Sie diese PAYG-Tarife einordnen möchten, vergleichen Sie sie mit Modellen, deren Preisstruktur Sie bereits kennen. Falls Sie Claude Fable 5 bewertet haben, kennen Sie bereits die typische Form der Grenzmodell-Abrechnung.

Was Passthrough-Abrechnung praktisch bedeutet

Lesen Sie den Passthrough-Anspruch genau. Die Basisvariante Fugu nutzt Berichten zufolge den Tarif des zugrunde liegenden Modells, das sie aufruft, ohne zusätzlich eine separate Orchestrierungsgebühr pro Agent zu stapeln. Trotzdem heißt das nicht, dass jede Anfrage billig ist.

Die Kosten entstehen aus zwei Teilen:

Der Orchestrator
- Fugu entscheidet, ob es selbst antwortet oder andere Modelle aufruft.
- Das Trinity-Paper beschreibt einen evolutionär optimierten Koordinator mit unter 20.000 Parametern.
- Das Conductor-Paper beschreibt ein 7B-Modell, das mit Reinforcement Learning trainiert wurde und behauptet, Mixture-of-Agents zu geringeren Kosten zu übertreffen.
- Der Orchestrator selbst ist wahrscheinlich nicht der Hauptkostentreiber.
Die Worker-Modelle
- Wenn Fugu entscheidet, dass ein schwieriges Problem ein Frontier-Modell braucht, ruft es eines auf.
- Dann zahlen Sie die entsprechenden Frontier-Tokens plus Sakana’s Marge für die Orchestrierung.
- Bei Fugu Ultra und PAYG-Tarifen liegen die Preise deshalb höher als bei einfachen Worker-Modellen.

Kurz gesagt: Ein günstiger Dirigent, der teure Arbeitskräfte einsetzt, kann trotzdem eine hohe Rechnung erzeugen.

Fugu’s Kostenargument ist, dass teure Modelle nur dann aktiviert werden, wenn sie nötig sind. Ob das günstiger ist, als direkt ein Frontier-Modell aufzurufen, hängt von Ihrem Traffic-Mix ab:

Viele einfache Prompts + wenige schwierige Prompts: Fugu kann wirtschaftlich interessant sein.
Durchgehend schwierige Prompts mit Frontier-Qualitätsbedarf: Fugu kann ähnlich teuer oder teurer werden.
Lange Kontexte: Prüfen Sie den 272K-Aufschlag besonders genau.

Verankerung an realen Grenzmodellpreisen

Sie sollten Fugu’s gemeldete Zahlen nicht isoliert betrachten. Vergleichen Sie sie mit Modellen, deren Preise veröffentlicht sind. Die folgenden Zahlen stammen von Anthropic’s Preisgestaltung vom 2026-06-09 und sind nicht als gemeldete Fugu-Werte zu verstehen.

Modell	Eingabe pro 1 Mio.	Ausgabe pro 1 Mio.	Einordnung
Fable 5	$10	$50	Anthropic’s leistungsstärkstes allgemein verfügbares Modell, eine Stufe über Opus 4.8
Mythos 5	$10	$50	Gleiche Preisspanne wie Fable 5
Mythos Preview	$25	$125	Das im April 2026 zurückgehaltene Grenzmodell, das als „zu gefährlich zur Veröffentlichung“ galt

Verglichen mit Fugu’s gemeldeten PAYG-Tarifen von etwa $5 Eingabe und $30 Ausgabe pro Million Tokens sieht Fugu auf dem Papier günstiger aus. Dieser Vergleich ist aber nur dann sinnvoll, wenn Sie auch die Architektur berücksichtigen.

Sakana sagt, dass Fugu Ultra bei technischen, wissenschaftlichen und logischen Benchmarks „auf Augenhöhe mit führenden Modellen wie Fable 5 und Mythos Preview“ liegt. Das ist eine Gleichwertigkeitsbehauptung, keine „übertrifft alles“-Behauptung.

Wichtig für Entwickler: Fugu ist kein einzelnes Modell mit einem einfachen Preisschild. Es ist ein System, das andere Modelle aufrufen kann, einschließlich rekursiver Aufrufe seiner selbst. Wenn ein Fugu-Lauf Frontier-Qualität liefert, kann das daran liegen, dass Fugu ein Frontier-Modell aktiviert und dessen Antwort synthetisiert hat.

Wenn Sie Fugu neben diesen Modellen evaluieren, hilft der Leitfaden wie man Sakana Fugu zugreift beim Einstieg. Der zentrale Unterschied bleibt: Fable 5 und Mythos sind Einzelmodelle mit veröffentlichten Tarifen. Fugu ist ein Orchestrierungssystem, dessen effektive Kosten davon abhängen, welche Modelle es intern aufweckt.

Fugu über einen OpenAI-kompatiblen Client aufrufen

Fugu stellt einen OpenAI-kompatiblen Endpunkt bereit. Sie können also einen bestehenden OpenAI-Client verwenden und nur API-Key, Base-URL und Modell-ID austauschen.

Die Basis-URL ist öffentlich nicht eindeutig dokumentiert. Kopieren Sie sie aus Ihrer Sakana-Konsole und hardcodieren Sie keinen vermuteten Host.

from openai import OpenAI

# Kopieren Sie die echte Basis-URL aus console.sakana.ai.
client = OpenAI(
    api_key="YOUR_SAKANA_API_KEY",
    base_url="<YOUR_FUGU_BASE_URL_FROM_CONSOLE>",
)

response = client.chat.completions.create(
    model="fugu",  # oder "fugu-ultra", je nach bestätigter Modell-ID in Ihrer Konsole
    messages=[
        {
            "role": "user",
            "content": "Review this function for security issues."
        },
    ],
)

print(response.choices[0].message.content)

# Wichtig für Kostenkontrolle:
print(response.usage)

Die gemeldeten Modell-IDs sind fugu und fugu-ultra, möglicherweise mit datiertem Suffix. Bestätigen Sie die exakten IDs in Ihrer Konsole.

Für die Kostenkontrolle sollten Sie response.usage bei jeder Anfrage speichern. Bei einem Orchestrator ist diese Nutzung das wichtigste Signal, weil interne Aufrufe in der finalen Token-Zählung sichtbar werden.

Ein einfaches Logging kann so aussehen:

usage = response.usage

log_entry = {
    "model": "fugu",
    "prompt_tokens": usage.prompt_tokens,
    "completion_tokens": usage.completion_tokens,
    "total_tokens": usage.total_tokens,
}

print(log_entry)

Wenn Sie Requests über mehrere Experimente hinweg vergleichen, speichern Sie zusätzlich:

Prompt-Typ
Kontextlänge
Modell-ID
Latenz
total_tokens
Ergebnisqualität nach eigener Bewertung
ob langer Kontext genutzt wurde

Die Anfrage- und Antwortstruktur folgt dem Standardvertrag der OpenAI Chat Completions API. Alles, was dieses Protokoll spricht, sollte grundsätzlich ohne große Änderungen funktionieren. Eine vollständige Einrichtung finden Sie im Leitfaden wie man die Sakana Fugu API verwendet.

Praktische Checkliste für die Kostenmessung

Bevor Sie sich für ein Abonnement oder PAYG entscheiden, testen Sie Ihre echten Workloads.

Testset erstellen
- 20 bis 50 typische Prompts sammeln.
- Einfache, mittlere und schwierige Fälle trennen.
- Lange-Kontext-Fälle separat markieren.
Beide Varianten testen
- fugu für Standardfälle.
- fugu-ultra für Qualitätsgrenzen.
- Modell-IDs vorher in der Konsole bestätigen.
Usage pro Request speichern
- prompt_tokens
- completion_tokens
- total_tokens
Kosten grob hochrechnen
- Durchschnittliche Tokens pro Request bestimmen.
- Mit erwarteter Request-Anzahl pro Monat multiplizieren.
- Lange-Kontext-Aufschläge separat kalkulieren.
Qualität gegen Kosten bewerten
- Nicht nur Tokenpreise vergleichen.
- Prüfen, ob Fugu bei einfachen Prompts günstiger bleibt.
- Prüfen, ob schwierige Prompts regelmäßig Frontier-ähnliche Kosten verursachen.
Konsole als Quelle der Wahrheit nutzen
- Gemeldete Preise validieren.
- Startaktionen prüfen.
- Modell-IDs und Base-URL bestätigen.

Häufig gestellte Fragen

Hat Fugu eine kostenlose Stufe?

Es wurde keine eigenständige kostenlose Stufe gemeldet. Das nächstgelegene Angebot ist eine Startaktion, die Berichten zufolge einen kostenlosen zweiten Monat gewährt, wenn Sie vor Ende Juli 2026 abonnieren. Diese Aktion ist auf der Release-Seite nicht bestätigt. Prüfen Sie sie deshalb live in Ihrer Konsole unter console.sakana.ai, bevor Sie sich darauf verlassen.

Warum erscheint Fugu pro Token günstiger, könnte aber mehr kosten?

Der gemeldete Pro-Token-Preis beschreibt nicht automatisch die gesamten effektiven Kosten einer komplexen Anfrage. Fugu ist ein Orchestrator, der schwierige Aufgaben an andere Modelle delegieren kann. Wenn diese Worker-Modelle teuer sind, steigen die Gesamtkosten. Ein einzelnes Frontier-Modell hat dagegen einen klar veröffentlichten Tarif ohne interne Verzweigung. Deshalb ist die Claude Fable 5 Preisaufschlüsselung ein sauberer Vergleichspunkt.

Was ist Passthrough-Abrechnung bei Fugu?

Die Basis-Fugu-Variante wird Berichten zufolge zum Standardtarif des zugrunde liegenden Modells abgerechnet, das sie aufruft, ohne eine separate Orchestrierungsgebühr pro Agent obendrauf zu stapeln. Für Premium-Varianten und PAYG-Tarife kann trotzdem eine Sakana-Marge enthalten sein.

Sollte ich ein Abonnement oder Pay-as-you-go wählen?

Wählen Sie ein Abonnement, wenn Sie konstante tägliche Nutzung haben, etwa für Coding, Reviews oder Chatbots. Die feste monatliche Preisgestaltung ist dann besser planbar.

Wählen Sie Pay-as-you-go, wenn Ihre Workloads stark schwanken, sehr groß sind oder aus Forschungs- und Batch-Jobs bestehen. Planen Sie dabei den gemeldeten Aufschlag für lange Kontexte über etwa 272K Tokens ein.

Wie verfolge ich, was eine Fugu-Anfrage kostet?

Protokollieren Sie bei jeder Antwort das Feld usage. Es fasst die Token-Nutzung der Anfrage zusammen und ist damit Ihr wichtigstes Signal für die Kosten. Wenn Sie Fugu mit Routing-Aggregatoren vergleichen, erklärt der Leitfaden zu den besten OpenRouter-Alternativen, wie Sie Routing-Kosten gegenüber Orchestrierungskosten einordnen.

Fazit

Fugu’s Preisgestaltung belohnt Workloads, die überwiegend einfach sind und nur gelegentlich schwierige Probleme enthalten. Workloads, die dauerhaft Frontier-Qualität oder extrem lange Kontexte benötigen, können dagegen schnell teuer werden.

Die beste Vorgehensweise ist daher:

echte Prompts testen,
usage pro Request speichern,
lange Kontexte separat auswerten,
gemeldete Preise in der Konsole bestätigen,
Abonnement und PAYG anhand Ihrer tatsächlichen Token-Nutzung vergleichen.

Um Ihre Fugu-Token-Ausgaben Anfrage für Anfrage beim Testen zu verfolgen, laden Sie Apidog herunter und leiten Sie Ihre OpenAI-kompatiblen Aufrufe darüber.

DEV Community