DEV Community

Everlast AI for Everlast AI

Posted on

Claude Opus 4.7 im Test: Warum das neue Modell mehr kostet und weniger hält als versprochen

Claude Opus 4.7 ist seit dieser Woche live. Anthropic bewirbt das Modell als den bisher stärksten Coding-Agenten am Markt. Doch unter der Oberfläche zeigt sich ein ganz anderes Bild. Du liest hier, was Opus 4.7 wirklich kann, wo versteckte Kosten lauern und warum OpenAI mit Codex jetzt aggressiv kontert.

Claude Opus 4.7: Die Benchmarks sehen stark aus

Auf dem Papier liefert das neue Modell eindrucksvolle Zahlen. Auf SWE-Bench Verified springt Opus 4.7 von 80,8 auf 87,6 Prozent. Bei SWE-Bench Pro klettert der Score von 53,4 auf 64,3 Prozent. Damit schlägt Anthropic das konkurrierende GPT 5.4 deutlich.

Neu ist auch das Reasoning-Level X-High. Laut Anthropics eigener System Card liefert dieser Modus mehr Tiefe als der bisherige Max-Mode. Dazu kommt ein Kontextfenster von einer Million Token. Der Listenpreis bleibt gleich: 5 Dollar pro Million Input- und 25 Dollar pro Million Output-Token.

Auch auf der Vending Bench 2 glänzt das Modell. In der Simulation eines autonom geführten Getränkeautomaten erreicht Opus 4.7 einen Jahresendsaldo von 10.937 Dollar. Der Vorgänger Opus 4.6 lag bei 8.000 Dollar. Das ist ein Sprung von rund 36 Prozent.

Cloud Routines und neue Funktionen rund um Opus 4.7

Anthropic startet parallel Cloud Routines. Damit legst du wiederkehrende Tasks einmal an. Sie laufen dann nach Zeitplan automatisch auf Anthropics Servern. Dein Laptop muss nicht mehr offen sein.

Im Web-Development zeigt sich das Modell ebenfalls stark. Auf einen simplen Prompt baut Opus 4.7 eine funktionierende Uhr mit tickenden Zeigern als Mauszeiger. Auch im CAD-Design, also der Generierung technischer Konstruktionszeichnungen, setzt das Modell einen neuen Standard. Der Unterschied zu Opus 4.6 wird direkt spürbar, wenn du die beiden Versionen vergleichst. Details zum Vorgänger findest du in unserem Guide zu Claude Opus 4.6.

Der neue Tokenizer: Die versteckte Preiserhöhung

Hier wird es unangenehm. Anthropic hat den Tokenizer komplett neu gebaut. Die Zerlegung in Tokens ist jetzt deutlich feiner. Die Folge: Opus 4.7 verbraucht bis zum 1,3-Fachen der Tokens pro Input.

Dazu kommt die neue Standardeinstellung Adaptive Thinking. Der alte Extended-Thinking-Button ist weg. Ein eigenes Token-Budget kannst du nicht mehr setzen. Auch das Standard-Reasoning-Level steht ab Werk auf X-High.

Effektiv zahlst du damit 10 bis 40 Prozent mehr pro Aufgabe. Der gleiche Listenpreis wie bei Opus 4.6 ist also Augenwischerei. Wer Kosten kontrollieren will, sollte den Effort-Level auf Medium oder High herunterstellen.

Opus 4.6 wurde heimlich gedrosselt

Viele Nutzer meldeten schon Anfang April Qualitätsprobleme. Auf dem privaten Bridge-Bench fiel der Halluzinations-Score von Opus 4.6 von 83,3 auf 68,3 Prozent. Das Modell rutschte von Platz 2 auf Platz 10 ab.

Stella Laurenzo, Senior Director of AI bei AMD, hat zwischen Januar und März 6.852 Cloud-Code-Sessions ausgewertet. Die sichtbare Thinking-Länge schrumpfte um 73 Prozent. Die Zahl der gelesenen Dateien vor einer Änderung sank von 6,6 auf 2. Die Ask-for-Permission-Unterbrechungen stiegen von fast null auf 43 pro Tag.

Anthropic hat gegenüber Fortune eingestanden, den Default-Effort von Opus 4.6 auf Medium gesenkt zu haben. Offiziell, um Tokens zu sparen. Kritiker sehen es anders: Opus 4.6 sei bewusst verschlechtert worden, damit Opus 4.7 besser wirkt.

Das Compute-Problem hinter Claude Opus 4.7

Der eigentliche Grund für diese Schritte liegt tiefer. Anthropic hat schlicht nicht genug Rechenleistung. Der Run-Rate-Umsatz sprang von 9 Milliarden Dollar Ende 2025 auf 30 Milliarden im April 2026. Die Nachfrage explodiert.

Laut Dylan Patel von SemiAnalysis bräuchte Anthropic bis Ende 2026 mehr als 5 Gigawatt Inferenz-Kapazität. Gesichert sind aktuell rund 2 Gigawatt. Der neue Broadcom-und-Google-Deal über 3,5 Gigawatt TPU kommt erst 2027. Genau in dieser Lücke entsteht der Engpass.

Am Mittwoch waren Claude AI, die API und Cloud Code drei Stunden lang komplett offline. Einen Tag später folgte der Opus-4.7-Launch. Der Zusammenhang ist kein Zufall.

OpenAI Codex holt auf und wird zur Super-App

OpenAI nutzt die Compute-Lücke gezielt aus. Nur Tage vor dem Opus-4.7-Launch verschickte das Unternehmen ein internes Memo an Investoren. Darin: 1,9 Gigawatt Rechenleistung Ende 2025, gegenüber 1,4 Gigawatt bei Anthropic. Warum Codex zur entscheidenden Plattform wird, vertiefen wir im Artikel zu Coding-Agents und Codex als OpenAI-Super-App.

Parallel liefert OpenAI ein massives Codex-Update. Es bringt Computer Use, also direkte Bedienung von macOS-Anwendungen. Dazu ein In-Browser-Editor mit Kommentarfunktion. Kostenfreie Bildgenerierung via GPT Image 1.5 ist ebenfalls dabei. Plus 111 neue Plugins, darunter Atlassian und Microsoft Office.

Der In-Browser-Editor ist besonders praktisch. Du baust eine Landing Page per Prompt und markierst dann Elemente direkt im Browser. Über die Kommentarfunktion gibst du gezielte Änderungswünsche. Codex setzt sie in Sekunden um.

GPT Rosalind: KI verlässt den Chat

OpenAI launcht zudem GPT Rosalind. Das Modell ist nach DNA-Pionierin Rosalind Franklin benannt. Es ist als Frontier-Reasoning-Modell für Biologie, Medikamentenentwicklung und translationale Medizin gebaut. Damit verlässt KI endgültig den reinen Chat-Kontext.

Das Biotech-Startup Invitris aus München zeigt, was möglich wird. CEO Patrick Großmann hat gerade 12,5 Millionen Euro eingesammelt. Seine Firma baut Proteine ohne lebende Bakterien. Statt zehn Tagen dauert die Herstellung 4 bis 8 Stunden. Die Technologie ist 10.000-mal effizienter als der klassische Weg.

Business-Chance: Agentic Coding im Videoediting

Ein starker neuer Use Case ist Videoediting mit Coding-Agenten. Drei Anwendungen funktionieren heute schon zuverlässig. Erstens: Rohschnitt. Der Agent analysiert Transkript und Audiospur, erkennt Versprecher und exportiert eine fertige DaVinci-Timeline.

Zweitens: Motion Graphics. Der Agent generiert Animationen erst als HTML und rendert sie dann als MP4. Drittens: Untertitel in beliebigen Sprachen. Schluss mit externen Tools für 50 Dollar im Monat.

Fazit: Claude Opus 4.7 ist ein ehrlicher Schritt zurück

Claude Opus 4.7 liefert stärkere Benchmarks als Opus 4.6. Gleichzeitig treibt der neue Tokenizer die Kosten versteckt nach oben. Der Adaptive-Thinking-Mode nimmt dir Kontrolle weg. Und das Compute-Problem zwingt Anthropic zu Abstrichen bei der Qualität.

OpenAI spielt diese Schwäche jetzt aus. Codex wird zur visuellen Coding-Plattform mit Bildgenerierung und Browser-Integration. Wer auf KI-gestützte Entwicklung setzt, sollte beide Tools parallel testen. Der Vorsprung im Agentic Coding entscheidet in den nächsten Monaten über Produktivität und Kostenstruktur.

Top comments (0)