CLI-first: Der groesste Shift seit ChatGPT
Die Kommandozeile entwickelt sich zur besten Art, mit KI-Agenten zu arbeiten. Kein UI-Klicken, kein Drag-and-Drop. Stattdessen: ein Terminal, ein Agent, ein Ergebnis.
Mehrere grosse Updates unterstreichen diesen Trend gleichzeitig. Claude Code, OpenAI Codex und 11 Labs CLI setzen auf dasselbe Prinzip. Der Agent arbeitet autonom im Terminal. Du gibst die Richtung vor.
Claude Code: Auto Mode und Desktop Use
Claude Code erhaelt gleich mehrere neue Funktionen. Die wichtigste: der Auto Mode. Er schliesst die Luecke zwischen zwei Extremen.
Bisher musstest du jeden Toolcall manuell bestaetigen. Oder du hast mit dangerously skip permissions alles durchgewunken. Auto Mode bietet den Sweet Spot.
Jeder Toolcall laeuft durch einen nativen Klassifizierer. Sichere Aktionen werden automatisch bestaetigt. Riskante Aktionen werden blockiert. Claude waehlt dann einen alternativen Ansatz. Aktivierung per Terminal:
claude enable auto-mode
Dazu kommt Desktop Use. Claude kann jetzt lokale Anwendungen auf deinem Desktop bedienen. Formulare ausfuellen, in Apps navigieren, Workflows ausfuehren. Browser-Use-Agents haben sich leise drastisch verbessert. Desktop Use hebt das auf die naechste Stufe.
Ausserdem integriert Claude Code jetzt Apps in die mobile App. Figma Designs, Canvas Slides und Dashboards erstellst du direkt vom Handy. Phone Use soll bald folgen.
OpenAI Codex: Plugins als Workflow-Standard
OpenAI veroeffentlicht Plugins für Codex. Plugins buendeln Skills, Apps und MCP-Server in einem Paket. Das macht sie besonders relevant für Teams.
Verfuegbare Plugins umfassen unter anderem:
- Slack - Channel-Zusammenfassungen und Nachrichtenverwaltung
- Figma - Design-Integration direkt im CLI
- GitHub - Repository-Workflows
- Gmail und Google Drive - E-Mail- und Dokumentenverwaltung
- Notion - Wissensdatenbank-Anbindung
- Stripe - Payment-Workflows
Plugins funktionieren in der Codex App und im CLI. Ein einfacher Befehl genuegt zur Aktivierung. Eigene Plugins lassen sich erstellen wie Skills in Claude Code.
OpenAI unterscheidet klar: Skills eignen sich für individuelle Experimente. Plugins lohnen sich beim standardisierten Rollout aufs Team.
11 Labs CLI: Voice Agents per Terminal
11 Labs veroeffentlicht ein CLI mit agent-first-Ansatz. Statt Voice Agents im Web-UI zusammenzuklicken, beschreibst du den Agenten im Terminal.
Ein Praxisbeispiel: Ein Inbound Voice Agent für eine Unternehmenswebsite. Der CLI-Agent analysiert die Website automatisch. Er extrahiert Informationen in eine Knowledge Base. Er erstellt einen Workflow mit Intent-Erkennung und spezialisierten Subagenten.
Das Ergebnis: Ein funktionsfaehiger MVP in Minuten. Der Agent erkennt Anliegen, qualifiziert Leads und leitet weiter. Die Sisyphusarbeit der initialen Erstellung entfaellt komplett.
Die eigentliche Komplexitaet bleibt: Testing, Knowledge-Base-Optimierung und manuelle Iteration. Aber der Einstieg wird radikal einfacher.
ARC AGI 3 und das Agentica Framework
ARC AGI 3 ist die neue Benchmark von Francois Chollet. Menschen scoren bei 100 Prozent. KI liegt aktuell unter 1 Prozent. Die Aufgaben testen komplexes Reasoning ueber mehrere Faehigkeiten gleichzeitig.
Kurz nach Veroeffentlichung erreicht das Agentica Framework bereits 36,08 Prozent. Agentica ist kein einzelnes Modell. Es ist ein Agent-Harness: ein SDK, das Modelle in strukturierte Workflows einbettet.
Das unterstreicht eine zentrale Erkenntnis. Nicht die Modelle allein bringen Durchbrueche. Sondern das, was drumherum entsteht. Agent-Frameworks, Harnesses, Betriebssysteme für KI. Du kannst Agentica selbst testen auf agentica.symbolica.ai.
Was das für Developer bedeutet
Der Trend ist eindeutig. UIs werden zur Konfigurationsoberflaeche. Die eigentliche Arbeit passiert im Terminal.
Drei konkrete Schritte:
- Claude Code Auto Mode aktivieren und in den taeglichen Workflow integrieren
- Codex Plugins evaluieren für Team-Standardisierung ueber Slack, GitHub oder Notion
- CLI-basierte Agent-Erstellung testen mit 11 Labs CLI oder eigenen Tools
Die Kommandozeile war schon immer das maechtigste Werkzeug für Entwickler. Jetzt wird sie auch das beste Interface für KI-Agenten.
Top comments (0)