Emre Demir

Posted on Jun 10 • Originally published at apidog.com

Claude Fable 5 vs. Opus 4.8: Wann lohnt sich der doppelte Preis?

Anthropic hat Claude Fable 5 am 9. Juni 2026 veröffentlicht. Für Entwickler ist die wichtigste Frage bei Claude Fable 5 vs. Opus 4.8 nicht zuerst „welches Modell ist besser?“, sondern: Wann rechtfertigt Fable 5 den 2-fachen Tokenpreis? Fable 5 kostet 10 $ pro Million Eingabe-Token und 50 $ pro Million Ausgabe-Token. Opus 4.8 kostet 5 $ bzw. 25 $. Beide laufen über dieselbe Messages API. Wenn Sie zuerst den Hintergrund zum älteren Modell benötigen, lesen Sie den Leitfaden zu Claude Opus 4.8.

Teste Apidog noch heute

TL;DR

Opus 4.8 ist der bessere Default für Chat, Code-Generierung, Review, RAG und interaktive Workloads.
Fable 5 kostet exakt 2x so viel wie Opus 4.8: 10 $/50 $ vs. 5 $/25 $ pro 1 Mio. Token.
Fable 5 lohnt sich, wenn Ihre Aufgabe sehr lange autonom läuft, über sehr große Kontexte kohärent bleiben muss oder persistenten Speicher nutzt.
Implementierungsseitig ist der Wechsel trivial: Sie ändern nur die Modell-ID in der Anthropic Messages API.
Praktische Strategie: Standardmäßig Opus 4.8 verwenden, nur ausgewählte Workloads auf Fable 5 routen.

Claude Fable 5 vs. Opus 4.8 auf einen Blick

Dimension	Claude Fable 5	Claude Opus 4.8
API-Modell-ID	`claude-fable-5`	`claude-opus-4-8`
Eingabepreis pro 1 Mio. Token	10,00 $	5,00 $
Ausgabepreis pro 1 Mio. Token	50,00 $	25,00 $
Relative Kosten	2x Opus 4.8	Basislinie
Kontext	Arbeitet über Millionen von Token; keine veröffentlichte feste Zahl	1M-Token-Kontextfenster
Denken und Aufwand	Adaptives Denken	Adaptives Denken + Aufwand: niedrig, mittel, hoch, sehr hoch, maximal
Positionierung	Mythos-Klasse, sicher für allgemeinen Gebrauch gemacht; leistungsfähigstes allgemein verfügbares Anthropic-Modell	Sehr leistungsfähig; vor Fable 5 Anthropics leistungsfähigstes allgemein verfügbares Modell
Beste Einsatzfälle	Sehr langfristige autonome Arbeit, große Migrationen, mehrstündige Agenten	Chat, Code-Generierung, RAG, interaktive Workloads

Wichtig beim Kontextfenster: Anthropic hat für Fable 5 keine präzise Kontextgröße veröffentlicht. Das Modell wird als stark bei Arbeit über Millionen von Token beschrieben. Behandeln Sie das als qualitative Stärke, nicht als harte Spezifikation. Opus 4.8 hat dagegen ein dokumentiertes 1M-Token-Fenster. Wenn Ihre Architektur eine zitierbare Kontextzahl benötigt, ist Opus 4.8 die klarere Wahl. Die veröffentlichten Spezifikationen stehen in Anthropics Modellübersicht. Mehr Hintergrund finden Sie im Erklärer zu Claude Fable 5 und in der Aufschlüsselung der Opus 4.8-Preise.

Preis: Fable 5 kostet genau doppelt so viel

Beginnen Sie jede Entscheidung mit der Kostenrechnung.

Modell	Eingabe pro 1 Mio. Token	Ausgabe pro 1 Mio. Token
Claude Fable 5	10,00 $	50,00 $
Claude Opus 4.8	5,00 $	25,00 $

Pro 1.000 Token:

Fable 5: 0,010 $ Eingabe, 0,050 $ Ausgabe
Opus 4.8: 0,005 $ Eingabe, 0,025 $ Ausgabe

Die aktuellen Preise finden Sie auf der Preisseite von Anthropic.

Beispielrechnung für eine Produktionsfunktion

Angenommen, eine Funktion verarbeitet pro Monat:

200 Mio. Eingabe-Token
40 Mio. Ausgabe-Token

Kosten mit Opus 4.8:

200 * 5 $  = 1.000 $
40  * 25 $ = 1.000 $
Gesamt     = 2.000 $

Kosten mit Fable 5:

200 * 10 $ = 2.000 $
40  * 50 $ = 2.000 $
Gesamt     = 4.000 $

Dieselbe Arbeitslast kostet mit Fable 5 also 2.000 $ mehr pro Monat. Der Aufpreis skaliert linear mit dem Traffic.

Die richtige Frage lautet daher nicht:

Ist Fable 5 besser?

Sondern:

Ist Fable 5 für diese konkrete Arbeitslast gut genug, um die Verdopplung der Modellkosten zu rechtfertigen?

Für eine detailliertere Kostenbetrachtung lesen Sie die Opus 4.8-Preisanalyse oder den Claude Fable 5-Preisleitfaden.

Wo Fable 5 stärker ist

Fable 5 ist kein reines Rebranding von Opus 4.8. Es ist für andere Grenzfälle optimiert: lange, autonome, mehrstufige Arbeit.

Anthropic beschreibt Fable 5 in der Claude Fable 5-Ankündigung als Modell der Mythos-Klasse, das für allgemeinen Gebrauch sicher gemacht wurde und über Millionen von Token fokussiert bleiben kann.

Das ist relevant, wenn Ihre Anwendung nicht nur eine einzelne Antwort generiert, sondern über lange Zeit:

Pläne erstellt
Zwischenergebnisse speichert
viele Teilschritte ausführt
Code oder Dokumente wiederholt überprüft
Entscheidungen über große Kontexte hinweg konsistent halten muss

Beispiel: große Code-Migration

Anthropic nennt als Demonstration eine Migration einer Ruby-Codebasis mit 50 Millionen Zeilen für Stripe, die Fable 5 an einem Tag ausführte. Das Team hatte die Arbeit auf zwei Monate oder länger geschätzt.

Der Punkt ist nicht nur „Code schreiben“. Der Engpass bei solchen Aufgaben ist:

Kontext über viele Dateien behalten
Plan über lange Zeit nicht verlieren
Änderungen konsistent durchführen
Abhängigkeiten und Nebenwirkungen berücksichtigen

Für diese Art Arbeit ist Fable 5 gebaut.

Beispiel: Agenten mit persistentem Speicher

In einem Slay-the-Spire-Test führte persistenter Dateispeicher bei Fable 5 zu einer 3-fachen Verbesserung gegenüber Opus 4.8.

Übertragen auf Entwickler-Workloads heißt das: Wenn Ihr Agent über lange Sitzungen hinweg mit einem Scratchpad, Planfile oder strukturiertem Speicher arbeitet, kann Fable 5 diesen Speicher effektiver nutzen.

Typische passende Aufgaben:

mehrstündige Coding-Agenten
große Refactorings
Migrationsagenten
komplexe Rechercheagenten
Agenten, die Zwischenstände in Dateien speichern und später wieder lesen

Benchmarks und Einschränkungen

Fable 5 erreichte laut Anthropic in vielen Fällen State-of-the-Art-Platzierungen, unter anderem bei FrontierCode, FrontierBench von Cognition, CursorBench und Hebbias Finance Benchmark. Da keine vollständigen öffentlichen Ergebnisse genannt wurden, sollten diese Aussagen als richtungsweisend betrachtet werden, nicht als harte Zahlen für Ihr Architektur-Dokument.

Wichtig: Fable 5 kann bestimmte sensible Kategorien wie Cybersicherheit, Biologie, Chemie und Modell-Destillationsanfragen an Opus 4.8 weiterleiten. Anthropic gibt an, dass dies in weniger als 5 % der Sitzungen passiert. Für normale Workloads dürfte das selten auffallen, ist aber ein realer Verhaltensunterschied.

Für breitere Modellvergleiche lesen Sie den Opus 4.8 vs. GPT-5.5 und Gemini 3.5 Vergleich und den Fable 5 vs. GPT-5.5 und Gemini 3.5 Artikel.

Wo Opus 4.8 die bessere Wahl ist

Für viele Produktions-Workloads ist Opus 4.8 die wirtschaftlich bessere Wahl.

Opus 4.8 war vor Fable 5 Anthropics leistungsfähigstes allgemein verfügbares Modell. Es hat weiterhin:

ein dokumentiertes 1M-Token-Kontextfenster
adaptives Denken
Aufwandseinstellungen von niedrig bis maximal
starke Leistung bei Chat, Code und RAG
den halben Tokenpreis von Fable 5

Wenn Ihre Aufgabe innerhalb von 1 Mio. Token bleibt und in einem kurzen Dialog oder einer kurzen Schleife gelöst wird, zahlen Sie mit Fable 5 wahrscheinlich für Fähigkeiten, die Sie nicht nutzen.

Workloads, die stark zu Opus 4.8 tendieren

Verwenden Sie Opus 4.8 für:

Interaktiven Chat
- kurze Turns
- Latenz relevant
- kein mehrstündiger Plan nötig
Code-Generierung auf begrenztem Scope
- Funktion
- Datei
- Pull Request
- Review-Kommentar
RAG und Dokumenten-Q&A
- relevanter Kontext passt in 1M Token
- fokussierte Frage
- dokumentiertes Kontextfenster wichtig
Kostenkritische API-Endpunkte
- hoher Traffic
- viele ähnliche Requests
- geringe Marge pro Anfrage

Ein zusätzlicher Hinweis: Wenn Fable 5 bei bestimmten Schutzmechanismen auf Opus 4.8 zurückgreift, ist das ein starkes Signal, dass Opus 4.8 robust genug für echten Traffic ist.

Der pragmatische Default:

Starten Sie mit Opus 4.8. Messen Sie Qualität, Latenz und Tokenkosten. Heben Sie nur die Workloads auf Fable 5, die nachweislich langfristige Autonomie benötigen.

Wenn selbst Opus 4.8 zu teuer oder zu stark für eine Aufgabe ist, kann Claude Sonnet 4.6 für einfachere High-Volume-Workloads günstiger sein. Setup-Details finden Sie im Opus 4.8 API-Leitfaden.

Entscheidungsrahmen: Welches Modell sollten Sie wählen?

Nutzen Sie diese Regeln als Routing-Logik.

Workload	Empfehlung
Kurzer Chat, Klassifizierung, Extraktion	Opus 4.8
Einzelnes Code-Snippet	Opus 4.8
Funktion, Datei oder Pull-Request prüfen	Opus 4.8
RAG innerhalb von 1M Token	Opus 4.8
Dokumenten-Q&A mit dokumentiertem Kontextfenster	Opus 4.8
Mehrstündiger autonomer Agent	Fable 5
Sehr große Code-Migration	Fable 5
Langlaufender Agent mit persistentem Speicher	Fable 5
Harte Kostenbeschränkung	Opus 4.8 oder günstigeres Modell

Die Meta-Regel:

Verwenden Sie Opus 4.8 als Default und routen Sie nur die wenigen Aufgaben zu Fable 5, die von langfristiger Kohärenz profitieren.

So vermeiden Sie, den gesamten Traffic um 100 % zu verteuern, nur weil ein kleiner Teil Ihrer Workloads ein stärkeres Modell braucht.

Wechsel zwischen Fable 5 und Opus 4.8 im Code

Beide Modelle laufen über dieselbe Anthropic Messages API. Sie müssen keinen neuen Client, keinen neuen Auth-Flow und kein neues Request-Schema einführen.

Sie ändern nur die Modell-ID:

claude-opus-4-8
claude-fable-5

Python-Beispiel

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-opus-4-8",  # für Fable 5 auf "claude-fable-5" ändern
    max_tokens=16000,
    thinking={"type": "adaptive"},
    messages=[
        {
            "role": "user",
            "content": "Fasse dieses Design-Dokument zusammen und liste offene Fragen auf."
        }
    ],
)

for block in response.content:
    if block.type == "text":
        print(block.text)

Einfaches Modell-Routing

In der Praxis sollten Sie das Modell nicht hart im Code verteilen. Legen Sie eine kleine Routing-Funktion an:

def select_model(task_type: str) -> str:
    long_running_tasks = {
        "large_migration",
        "multi_hour_agent",
        "persistent_memory_agent",
    }

    if task_type in long_running_tasks:
        return "claude-fable-5"

    return "claude-opus-4-8"

Dann verwenden Sie die Auswahl pro Request:

task_type = "pull_request_review"

response = client.messages.create(
    model=select_model(task_type),
    max_tokens=8000,
    thinking={"type": "adaptive"},
    messages=[
        {
            "role": "user",
            "content": "Reviewe diesen Pull Request und markiere riskante Änderungen."
        }
    ],
)

Damit bleibt Ihre Architektur flexibel:

Standardtraffic läuft über Opus 4.8.
Teure Langläufer gehen gezielt an Fable 5.
Sie können später weitere Modelle ergänzen.
Kostenkontrolle bleibt zentralisiert.

Für die vollständige Schnittstelle lesen Sie den Opus 4.8 API-Walkthrough und den Fable 5 API-Leitfaden.

Fable 5 und Opus 4.8 selbst mit Apidog vergleichen

Preistabellen und Benchmarks helfen nur begrenzt. Am besten testen Sie beide Modelle mit Ihren echten Prompts.

Mit Apidog können Sie dafür ein kleines A/B-Harness bauen:

Erstellen Sie eine Anfrage an die Anthropic Messages API.
Setzen Sie als Modell claude-opus-4-8.
Duplizieren Sie die Anfrage.
Ändern Sie nur das Modellfeld auf claude-fable-5.
Verwenden Sie denselben Prompt für beide Requests.
Vergleichen Sie Antwortqualität, Latenz und Tokenverbrauch.

Testen Sie keine Spielzeugprompts. Verwenden Sie Prompts, die Ihrem echten Produktionstraffic ähneln:

echte Supportfragen
echte PR-Diffs
echte Dokumentenauszüge
echte Agentenaufgaben
echte RAG-Kontexte

Bewerten Sie anschließend:

Welche Antwort ist korrekter?
Welche Antwort ist vollständiger?
Welche Antwort benötigt weniger Nacharbeit?
Wie groß ist der Latenzunterschied?
Wie viele Eingabe- und Ausgabe-Token wurden verbraucht?
Rechtfertigt der Qualitätsgewinn den 2-fachen Preis?

Speichern Sie beide Requests als kleine Sammlung. So können Sie den Vergleich wiederholen, wenn sich Prompts, Daten oder Modelle ändern.

Wenn Sie es ausprobieren möchten, laden Sie Apidog herunter und erstellen Sie die beiden Requests in wenigen Minuten. Apidog hält den gesamten Vergleich an einem Ort.