Anthropic hat Claude Fable 5 am 9. Juni 2026 veröffentlicht. Für Entwickler ist die wichtigste Frage bei Claude Fable 5 vs. Opus 4.8 nicht zuerst „welches Modell ist besser?“, sondern: Wann rechtfertigt Fable 5 den 2-fachen Tokenpreis? Fable 5 kostet 10 $ pro Million Eingabe-Token und 50 $ pro Million Ausgabe-Token. Opus 4.8 kostet 5 $ bzw. 25 $. Beide laufen über dieselbe Messages API. Wenn Sie zuerst den Hintergrund zum älteren Modell benötigen, lesen Sie den Leitfaden zu Claude Opus 4.8.
TL;DR
- Opus 4.8 ist der bessere Default für Chat, Code-Generierung, Review, RAG und interaktive Workloads.
- Fable 5 kostet exakt 2x so viel wie Opus 4.8: 10 $/50 $ vs. 5 $/25 $ pro 1 Mio. Token.
- Fable 5 lohnt sich, wenn Ihre Aufgabe sehr lange autonom läuft, über sehr große Kontexte kohärent bleiben muss oder persistenten Speicher nutzt.
- Implementierungsseitig ist der Wechsel trivial: Sie ändern nur die Modell-ID in der Anthropic Messages API.
- Praktische Strategie: Standardmäßig Opus 4.8 verwenden, nur ausgewählte Workloads auf Fable 5 routen.
Claude Fable 5 vs. Opus 4.8 auf einen Blick
| Dimension | Claude Fable 5 | Claude Opus 4.8 |
|---|---|---|
| API-Modell-ID | claude-fable-5 |
claude-opus-4-8 |
| Eingabepreis pro 1 Mio. Token | 10,00 $ | 5,00 $ |
| Ausgabepreis pro 1 Mio. Token | 50,00 $ | 25,00 $ |
| Relative Kosten | 2x Opus 4.8 | Basislinie |
| Kontext | Arbeitet über Millionen von Token; keine veröffentlichte feste Zahl | 1M-Token-Kontextfenster |
| Denken und Aufwand | Adaptives Denken | Adaptives Denken + Aufwand: niedrig, mittel, hoch, sehr hoch, maximal |
| Positionierung | Mythos-Klasse, sicher für allgemeinen Gebrauch gemacht; leistungsfähigstes allgemein verfügbares Anthropic-Modell | Sehr leistungsfähig; vor Fable 5 Anthropics leistungsfähigstes allgemein verfügbares Modell |
| Beste Einsatzfälle | Sehr langfristige autonome Arbeit, große Migrationen, mehrstündige Agenten | Chat, Code-Generierung, RAG, interaktive Workloads |
Wichtig beim Kontextfenster: Anthropic hat für Fable 5 keine präzise Kontextgröße veröffentlicht. Das Modell wird als stark bei Arbeit über Millionen von Token beschrieben. Behandeln Sie das als qualitative Stärke, nicht als harte Spezifikation. Opus 4.8 hat dagegen ein dokumentiertes 1M-Token-Fenster. Wenn Ihre Architektur eine zitierbare Kontextzahl benötigt, ist Opus 4.8 die klarere Wahl. Die veröffentlichten Spezifikationen stehen in Anthropics Modellübersicht. Mehr Hintergrund finden Sie im Erklärer zu Claude Fable 5 und in der Aufschlüsselung der Opus 4.8-Preise.
Preis: Fable 5 kostet genau doppelt so viel
Beginnen Sie jede Entscheidung mit der Kostenrechnung.
| Modell | Eingabe pro 1 Mio. Token | Ausgabe pro 1 Mio. Token |
|---|---|---|
| Claude Fable 5 | 10,00 $ | 50,00 $ |
| Claude Opus 4.8 | 5,00 $ | 25,00 $ |
Pro 1.000 Token:
- Fable 5: 0,010 $ Eingabe, 0,050 $ Ausgabe
- Opus 4.8: 0,005 $ Eingabe, 0,025 $ Ausgabe
Die aktuellen Preise finden Sie auf der Preisseite von Anthropic.
Beispielrechnung für eine Produktionsfunktion
Angenommen, eine Funktion verarbeitet pro Monat:
- 200 Mio. Eingabe-Token
- 40 Mio. Ausgabe-Token
Kosten mit Opus 4.8:
200 * 5 $ = 1.000 $
40 * 25 $ = 1.000 $
Gesamt = 2.000 $
Kosten mit Fable 5:
200 * 10 $ = 2.000 $
40 * 50 $ = 2.000 $
Gesamt = 4.000 $
Dieselbe Arbeitslast kostet mit Fable 5 also 2.000 $ mehr pro Monat. Der Aufpreis skaliert linear mit dem Traffic.
Die richtige Frage lautet daher nicht:
Ist Fable 5 besser?
Sondern:
Ist Fable 5 für diese konkrete Arbeitslast gut genug, um die Verdopplung der Modellkosten zu rechtfertigen?
Für eine detailliertere Kostenbetrachtung lesen Sie die Opus 4.8-Preisanalyse oder den Claude Fable 5-Preisleitfaden.
Wo Fable 5 stärker ist
Fable 5 ist kein reines Rebranding von Opus 4.8. Es ist für andere Grenzfälle optimiert: lange, autonome, mehrstufige Arbeit.
Anthropic beschreibt Fable 5 in der Claude Fable 5-Ankündigung als Modell der Mythos-Klasse, das für allgemeinen Gebrauch sicher gemacht wurde und über Millionen von Token fokussiert bleiben kann.
Das ist relevant, wenn Ihre Anwendung nicht nur eine einzelne Antwort generiert, sondern über lange Zeit:
- Pläne erstellt
- Zwischenergebnisse speichert
- viele Teilschritte ausführt
- Code oder Dokumente wiederholt überprüft
- Entscheidungen über große Kontexte hinweg konsistent halten muss
Beispiel: große Code-Migration
Anthropic nennt als Demonstration eine Migration einer Ruby-Codebasis mit 50 Millionen Zeilen für Stripe, die Fable 5 an einem Tag ausführte. Das Team hatte die Arbeit auf zwei Monate oder länger geschätzt.
Der Punkt ist nicht nur „Code schreiben“. Der Engpass bei solchen Aufgaben ist:
- Kontext über viele Dateien behalten
- Plan über lange Zeit nicht verlieren
- Änderungen konsistent durchführen
- Abhängigkeiten und Nebenwirkungen berücksichtigen
Für diese Art Arbeit ist Fable 5 gebaut.
Beispiel: Agenten mit persistentem Speicher
In einem Slay-the-Spire-Test führte persistenter Dateispeicher bei Fable 5 zu einer 3-fachen Verbesserung gegenüber Opus 4.8.
Übertragen auf Entwickler-Workloads heißt das: Wenn Ihr Agent über lange Sitzungen hinweg mit einem Scratchpad, Planfile oder strukturiertem Speicher arbeitet, kann Fable 5 diesen Speicher effektiver nutzen.
Typische passende Aufgaben:
- mehrstündige Coding-Agenten
- große Refactorings
- Migrationsagenten
- komplexe Rechercheagenten
- Agenten, die Zwischenstände in Dateien speichern und später wieder lesen
Benchmarks und Einschränkungen
Fable 5 erreichte laut Anthropic in vielen Fällen State-of-the-Art-Platzierungen, unter anderem bei FrontierCode, FrontierBench von Cognition, CursorBench und Hebbias Finance Benchmark. Da keine vollständigen öffentlichen Ergebnisse genannt wurden, sollten diese Aussagen als richtungsweisend betrachtet werden, nicht als harte Zahlen für Ihr Architektur-Dokument.
Wichtig: Fable 5 kann bestimmte sensible Kategorien wie Cybersicherheit, Biologie, Chemie und Modell-Destillationsanfragen an Opus 4.8 weiterleiten. Anthropic gibt an, dass dies in weniger als 5 % der Sitzungen passiert. Für normale Workloads dürfte das selten auffallen, ist aber ein realer Verhaltensunterschied.
Für breitere Modellvergleiche lesen Sie den Opus 4.8 vs. GPT-5.5 und Gemini 3.5 Vergleich und den Fable 5 vs. GPT-5.5 und Gemini 3.5 Artikel.
Wo Opus 4.8 die bessere Wahl ist
Für viele Produktions-Workloads ist Opus 4.8 die wirtschaftlich bessere Wahl.
Opus 4.8 war vor Fable 5 Anthropics leistungsfähigstes allgemein verfügbares Modell. Es hat weiterhin:
- ein dokumentiertes 1M-Token-Kontextfenster
- adaptives Denken
- Aufwandseinstellungen von niedrig bis maximal
- starke Leistung bei Chat, Code und RAG
- den halben Tokenpreis von Fable 5
Wenn Ihre Aufgabe innerhalb von 1 Mio. Token bleibt und in einem kurzen Dialog oder einer kurzen Schleife gelöst wird, zahlen Sie mit Fable 5 wahrscheinlich für Fähigkeiten, die Sie nicht nutzen.
Workloads, die stark zu Opus 4.8 tendieren
Verwenden Sie Opus 4.8 für:
-
Interaktiven Chat
- kurze Turns
- Latenz relevant
- kein mehrstündiger Plan nötig
-
Code-Generierung auf begrenztem Scope
- Funktion
- Datei
- Pull Request
- Review-Kommentar
-
RAG und Dokumenten-Q&A
- relevanter Kontext passt in 1M Token
- fokussierte Frage
- dokumentiertes Kontextfenster wichtig
-
Kostenkritische API-Endpunkte
- hoher Traffic
- viele ähnliche Requests
- geringe Marge pro Anfrage
Ein zusätzlicher Hinweis: Wenn Fable 5 bei bestimmten Schutzmechanismen auf Opus 4.8 zurückgreift, ist das ein starkes Signal, dass Opus 4.8 robust genug für echten Traffic ist.
Der pragmatische Default:
Starten Sie mit Opus 4.8. Messen Sie Qualität, Latenz und Tokenkosten. Heben Sie nur die Workloads auf Fable 5, die nachweislich langfristige Autonomie benötigen.
Wenn selbst Opus 4.8 zu teuer oder zu stark für eine Aufgabe ist, kann Claude Sonnet 4.6 für einfachere High-Volume-Workloads günstiger sein. Setup-Details finden Sie im Opus 4.8 API-Leitfaden.
Entscheidungsrahmen: Welches Modell sollten Sie wählen?
Nutzen Sie diese Regeln als Routing-Logik.
| Workload | Empfehlung |
|---|---|
| Kurzer Chat, Klassifizierung, Extraktion | Opus 4.8 |
| Einzelnes Code-Snippet | Opus 4.8 |
| Funktion, Datei oder Pull-Request prüfen | Opus 4.8 |
| RAG innerhalb von 1M Token | Opus 4.8 |
| Dokumenten-Q&A mit dokumentiertem Kontextfenster | Opus 4.8 |
| Mehrstündiger autonomer Agent | Fable 5 |
| Sehr große Code-Migration | Fable 5 |
| Langlaufender Agent mit persistentem Speicher | Fable 5 |
| Harte Kostenbeschränkung | Opus 4.8 oder günstigeres Modell |
Die Meta-Regel:
Verwenden Sie Opus 4.8 als Default und routen Sie nur die wenigen Aufgaben zu Fable 5, die von langfristiger Kohärenz profitieren.
So vermeiden Sie, den gesamten Traffic um 100 % zu verteuern, nur weil ein kleiner Teil Ihrer Workloads ein stärkeres Modell braucht.
Wechsel zwischen Fable 5 und Opus 4.8 im Code
Beide Modelle laufen über dieselbe Anthropic Messages API. Sie müssen keinen neuen Client, keinen neuen Auth-Flow und kein neues Request-Schema einführen.
Sie ändern nur die Modell-ID:
claude-opus-4-8claude-fable-5
Python-Beispiel
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8", # für Fable 5 auf "claude-fable-5" ändern
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[
{
"role": "user",
"content": "Fasse dieses Design-Dokument zusammen und liste offene Fragen auf."
}
],
)
for block in response.content:
if block.type == "text":
print(block.text)
Einfaches Modell-Routing
In der Praxis sollten Sie das Modell nicht hart im Code verteilen. Legen Sie eine kleine Routing-Funktion an:
def select_model(task_type: str) -> str:
long_running_tasks = {
"large_migration",
"multi_hour_agent",
"persistent_memory_agent",
}
if task_type in long_running_tasks:
return "claude-fable-5"
return "claude-opus-4-8"
Dann verwenden Sie die Auswahl pro Request:
task_type = "pull_request_review"
response = client.messages.create(
model=select_model(task_type),
max_tokens=8000,
thinking={"type": "adaptive"},
messages=[
{
"role": "user",
"content": "Reviewe diesen Pull Request und markiere riskante Änderungen."
}
],
)
Damit bleibt Ihre Architektur flexibel:
- Standardtraffic läuft über Opus 4.8.
- Teure Langläufer gehen gezielt an Fable 5.
- Sie können später weitere Modelle ergänzen.
- Kostenkontrolle bleibt zentralisiert.
Für die vollständige Schnittstelle lesen Sie den Opus 4.8 API-Walkthrough und den Fable 5 API-Leitfaden.
Fable 5 und Opus 4.8 selbst mit Apidog vergleichen
Preistabellen und Benchmarks helfen nur begrenzt. Am besten testen Sie beide Modelle mit Ihren echten Prompts.
Mit Apidog können Sie dafür ein kleines A/B-Harness bauen:
- Erstellen Sie eine Anfrage an die Anthropic Messages API.
- Setzen Sie als Modell
claude-opus-4-8. - Duplizieren Sie die Anfrage.
- Ändern Sie nur das Modellfeld auf
claude-fable-5. - Verwenden Sie denselben Prompt für beide Requests.
- Vergleichen Sie Antwortqualität, Latenz und Tokenverbrauch.
Testen Sie keine Spielzeugprompts. Verwenden Sie Prompts, die Ihrem echten Produktionstraffic ähneln:
- echte Supportfragen
- echte PR-Diffs
- echte Dokumentenauszüge
- echte Agentenaufgaben
- echte RAG-Kontexte
Bewerten Sie anschließend:
- Welche Antwort ist korrekter?
- Welche Antwort ist vollständiger?
- Welche Antwort benötigt weniger Nacharbeit?
- Wie groß ist der Latenzunterschied?
- Wie viele Eingabe- und Ausgabe-Token wurden verbraucht?
- Rechtfertigt der Qualitätsgewinn den 2-fachen Preis?
Speichern Sie beide Requests als kleine Sammlung. So können Sie den Vergleich wiederholen, wenn sich Prompts, Daten oder Modelle ändern.
Wenn Sie es ausprobieren möchten, laden Sie Apidog herunter und erstellen Sie die beiden Requests in wenigen Minuten. Apidog hält den gesamten Vergleich an einem Ort.


Top comments (0)