DEV Community

Cover image for CLI-Anything nutzen: Software Agent-nativ machen
Emre Demir
Emre Demir

Posted on • Originally published at apidog.com

CLI-Anything nutzen: Software Agent-nativ machen

CLI-Anything

CLI-Anything ist ein Open-Source-Plugin für KI-Codierungsagenten (vor allem Claude Code), das automatisch eine vollständige Befehlszeilenschnittstelle (CLI) für jede Software mit einer zugänglichen Codebasis generiert. Zeigen Sie es auf GIMP, Blender, LibreOffice oder eine andere Anwendung: Das Tool analysiert den Quellcode, identifiziert die internen APIs und erstellt eine strukturierte CLI, über die Ihr KI-Agent diese Software programmatisch steuern kann.

Teste Apidog noch heute

Das Problem: KI-Agenten können GUI-Software nicht verwenden

Die Softwarelandschaft ist zweigeteilt: Einerseits gibt es moderne API-First-Dienste (Cloud-Speicher, Zahlungsanbieter, E-Mail, Analytics) mit HTTP-Schnittstellen, die KI-Agenten direkt nutzen können. Andererseits stehen klassische Anwendungen wie GIMP, Blender, LibreOffice oder Audacity, die für menschliche Nutzer mit GUI entwickelt wurden und keine strukturierten APIs bieten.

Um KI-Agenten mit GUI-Software zu verbinden, bleiben meist nur zwei Möglichkeiten:

  • Eigene Wrapper programmieren (langsam, wartungsintensiv)
  • RPA-Tools nutzen (fragil wegen GUI-Änderungen)

CLI-Anything geht einen anderen Weg: Es analysiert den Quellcode, findet die APIs hinter den GUI-Aktionen und generiert darauf basierend eine echte CLI. Ihr KI-Agent muss keine GUI simulieren, sondern kann direkt strukturierte Befehle absetzen.

💡 Wenn Ihre Agenten-Workflows neben lokaler Software auch externe REST-APIs aufrufen müssen, übernimmt Apidog die API-Testseite. Es ist ein kostenloses Tool zum Senden, Überprüfen und Organisieren von API-Anfragen, sodass Sie API-Integrationen testen können, bevor Sie sie in Ihre Workflows übernehmen.

Was CLI-Anything leistet

CLI-Anything ist ein Open-Source-Plugin vom HKUDS Data Science Lab. Entwickler Chao Huang beschreibt es so:

"Die heutige Software dient den Menschen. Die Benutzer von morgen werden Agenten sein. CLI-Anything: Überbrückung der Kluft zwischen KI-Agenten und der weltweiten Software. Eine einzige Befehlszeile, um jede Software agentenfertig zu machen."

Das Plugin funktioniert primär mit Claude Code (experimentell auch mit Codex und OpenCode). Es analysiert die Ziel-Codebasis in einer 7-Phasen-Pipeline:

  1. Analysieren: Quellcode scannen, GUI-Aktionen zu APIs zuordnen, SOP-Dokument erstellen
  2. Design: Befehlsgruppen, Zustandsmodelle, Ausgabeformate entwerfen
  3. Implementieren: Python-CLI (Click-basiert) mit REPL, --json-Support, Undo/Redo generieren
  4. Tests planen: Testpläne in TEST.md erzeugen
  5. Tests schreiben: Unittests (test_core.py) und End-to-End-Tests (test_full_e2e.py) generieren
  6. Dokumentieren: Tests ausführen, Ergebnisse an TEST.md anhängen
  7. Veröffentlichen: setup.py und Konsolen-Entry-Points erstellen, in den PATH installieren

Am Ende erhalten Sie eine gebrauchsfertige CLI. Ihr KI-Agent kann diese mit which cli-anything-gimp finden, mit cli-anything-gimp --help inspizieren und programmatisch steuern.

Alle generierten CLIs haben konsistentes Design: Menschenlesbare Tabellenausgabe (Default), JSON-Ausgabe (--json), persistenten Zustand, Undo/Redo und einen interaktiven REPL-Modus. So müssen Sie oder Ihr Agent keine unterschiedlichen Interfaces für verschiedene Tools lernen.

CLI-Anything installieren

CLI-Anything ist ein Python-basiertes Plugin und kein npm-Paket. Sie installieren es im gewünschten KI-Agenten. Die generierten CLIs sind Python-Pakete, die mit pip install -e . installiert werden.

Anforderungen:

  • Python 3.10+
  • Zielsoftware muss installiert sein
  • Unterstützter KI-Agent (primär Claude Code, experimentell Codex und OpenCode)

Claude Code (empfohlen)

/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything
Enter fullscreen mode Exit fullscreen mode

Das Plugin ist nun aktiv und Sie können /cli-anything-Befehle in Claude Code nutzen.

OpenCode

Repository klonen und die Befehlsdateien plus HARNESS.md nach ~/.config/opencode/commands/ kopieren. Danach sind folgende Slash-Commands verfügbar: /cli-anything, /cli-anything-refine, /cli-anything-test, /cli-anything-validate, /cli-anything-list.

Codex

bash CLI-Anything/codex-skill/scripts/install.sh
Enter fullscreen mode Exit fullscreen mode

Qodercli

bash CLI-Anything/qoder-plugin/setup-qodercli.sh
Enter fullscreen mode Exit fullscreen mode

Hinweis für Windows

Git für Windows (mit bash und cygpath) oder WSL ist Pflicht. Die native Windows-Shell wird nicht unterstützt. Bei cygpath: command not found bitte Git für Windows installieren und erneut versuchen.

Installation der generierten CLI

Nach der Generierung installieren Sie die CLI so:

cd <software>/agent-harness
pip install -e .
Enter fullscreen mode Exit fullscreen mode

Das -e (editable) erlaubt es, Änderungen am generierten Code sofort zu nutzen.

Ihre erste CLI generieren

Mit installiertem Plugin genügt ein Befehl, um eine CLI zu erzeugen. Beispiel für GIMP:

In Claude Code:

/cli-anything ./gimp
Enter fullscreen mode Exit fullscreen mode

Oder für ein GitHub-Repository:

/cli-anything https://github.com/blender/blender
Enter fullscreen mode Exit fullscreen mode

Die 7 Phasen starten und dauern je nach Codebasis einige Minuten.

Während der Analysephase wird der Quellcode gescannt, GUI-Aktionen werden APIs zugeordnet (z.B. Ebenen erstellen, Filter anwenden). In der Implementierungsphase entsteht die Python-CLI auf Basis von Click, mit vollständigem Befehlssatz und JSON-Ausgabe.

Die Verzeichnisstruktur sieht z.B. so aus:

gimp/
  agent-harness/
    GIMP.md           # SOP-Dokument
    setup.py
    cli_anything/
      gimp/
        README.md
        gimp_cli.py   # CLI-Entry-Point
        core/
        utils/
        tests/
          test_core.py
          test_full_e2e.py
          TEST.md
Enter fullscreen mode Exit fullscreen mode

Alle CLIs liegen unter dem Namespace cli_anything.* (z.B. cli_anything.gimp) – das verhindert Konflikte bei mehreren Anwendungen.

Die generierte CLI verwenden

Nach pip install -e . im Verzeichnis agent-harness steht die CLI bereit:

cli-anything-gimp --help
Enter fullscreen mode Exit fullscreen mode

Alle Befehlsgruppen und Unterbefehle werden angezeigt, stets im Muster cli-anything-<software>.

Menschenlesbare Ausgabe (Standard)

cli-anything-gimp project new --width 1920 --height 1080
cli-anything-gimp layer list
cli-anything-gimp layer add --name "Background" --type solid --color "#ffffff"
cli-anything-gimp filter apply --name "gaussian-blur" --radius 3
cli-anything-gimp export save --format png --output ./output.png
Enter fullscreen mode Exit fullscreen mode

JSON-Ausgabe für KI-Agenten

cli-anything-gimp --json project new --width 1920 --height 1080
# => {"status": "ok", "project_id": "proj_abc123", "width": 1920, "height": 1080}

cli-anything-gimp --json layer add -n "Background"
# => {"status": "ok", "layer_id": "layer_001", "name": "Background"}
Enter fullscreen mode Exit fullscreen mode

Die JSON-Ausgabe ist konsistent: Felder wie status, operationsspezifische Daten und Fehlerdetails.

Interaktiver REPL-Modus

cli-anything-gimp
Enter fullscreen mode Exit fullscreen mode

Sie erhalten eine interaktive Shell mit farbigen Prompts, Tab-Completion und persistentem Verlauf – ideal zum Ausprobieren von Workflows.

Rückgängig/Wiederherstellen

cli-anything-gimp undo
cli-anything-gimp redo
Enter fullscreen mode Exit fullscreen mode

Ein 50-stufiger Undo-Stack erlaubt das Rückgängigmachen und Wiederholen von Befehlen.

Ihre CLI verfeinern und testen

Nicht jede CLI ist beim ersten Durchlauf vollständig. Mit /cli-anything:refine können Sie Lücken erkennen und Befehle ergänzen.

Allgemeine Verfeinerung

/cli-anything:refine /home/user/gimp
Enter fullscreen mode Exit fullscreen mode

Scannt die bestehende CLI, identifiziert fehlende Operationen und ergänzt neue Befehle.

Fokussierte Verfeinerung

/cli-anything:refine /home/user/blender "particle systems and physics simulation"
Enter fullscreen mode Exit fullscreen mode

Mit Fokusbeschreibung gezielt Bereiche abdecken.

Tests ausführen

/cli-anything:test /home/user/gimp
Enter fullscreen mode Exit fullscreen mode

Führt die Unittests und End-to-End-Tests aus, aktualisiert TEST.md mit Ergebnissen.

Validierung

/cli-anything:validate /home/user/gimp
Enter fullscreen mode Exit fullscreen mode

Überprüft das CLI-Harness anhand der HARNESS.md-Spezifikation.

Verfügbare CLIs auflisten

/cli-anything:list
/cli-anything:list --json
/cli-anything:list --path /home
Enter fullscreen mode Exit fullscreen mode

Anwendungsfälle in der Praxis

CLI-Anything wurde an 11 Anwendungen demonstriert. Beispiele:

Bildverarbeitungspipelines mit GIMP

Ein KI-Agent kann Produktbilder in Serie bearbeiten:

cli-anything-gimp project open --file product.jpg
cli-anything-gimp layer add --name "Watermark" --type image --source watermark.png
cli-anything-gimp layer position --name "Watermark" --x 10 --y 10
cli-anything-gimp export save --format webp --output product-final.webp
Enter fullscreen mode Exit fullscreen mode

Dokumentengenerierung mit LibreOffice

Dynamische PDF-Erstellung:

cli-anything-libreoffice document open --template invoice-template.ods
cli-anything-libreoffice cell set --address "B5" --value "Acme Corp"
cli-anything-libreoffice cell set --address "C10" --value "1500.00"
cli-anything-libreoffice export pdf --output invoice-2026-001.pdf
Enter fullscreen mode Exit fullscreen mode

3D-Rendering mit Blender

Skripting von Render-Jobs:

cli-anything-blender scene open --file product-scene.blend
cli-anything-blender render set --samples 256 --output /renders/product
cli-anything-blender render start --format png
Enter fullscreen mode Exit fullscreen mode

Streaming-Automatisierung mit OBS Studio

Steuerung von Szenen und Aufnahmen:

cli-anything-obs scene set --name "Main Camera"
cli-anything-obs recording start
cli-anything-obs scene set --name "Screen Share"
cli-anything-obs recording stop --output session.mp4
Enter fullscreen mode Exit fullscreen mode

CI/CD-Integration

Alle Beispiele lassen sich in CI/CD-Pipelines einbauen: automatisiertes Rendering bei jedem Commit oder PDF-Generierung aus Vorlagen.

Agenten-Workflows mit Apidog erstellen

CLI-Anything automatisiert lokale Software. Für die Anbindung externer APIs (z.B. Uploads, Dokumentenmanagement, Video-Review) empfiehlt sich Apidog als kostenloser API-Client für Test, Dokumentation und Automatisierung von REST-APIs.

Beispiel-Workflow:

  • GIMP-Bildverarbeitung mit CLI-Anything
  • Upload des Ergebnisses per Speicher-API, getestet mit Apidog

In Apidog:

  1. Umgebung mit API-Zugangsdaten einrichten
  2. Upload-Endpunkt mit Beispieldatei testen
  3. Response-Assertions setzen (z.B. Rückgabe der Datei-URL)
  4. Anfrage als Curl oder Code-Snippet exportieren und im Agenten-Skript verwenden

Das reduziert Debugging-Zyklen: Sie prüfen erst die API, bevor Sie sie im Workflow verwenden. Apidog unterstützt auch automatisierte Testsuiten für Regressionstests.

Bekannte Einschränkungen

Windows-Unterstützung erfordert Git Bash oder WSL

Generierte CLIs benötigen Bash-ähnliche Tools. Native PowerShell wird nicht unterstützt.

Zielsoftware muss installiert sein

CLI-Anything bringt die Software selbst nicht mit. Sie müssen z.B. GIMP, Blender, LibreOffice lokal installiert haben.

Nur Python-Ausgabe

Alle CLIs werden in Python (Click) generiert. Andere Sprachen werden nicht unterstützt.

Claude Code als stabile Plattform

Claude Code ist die primär getestete Umgebung. Codex und OpenCode sind experimentell.

Generierungsqualität abhängig von der Codebasis

Schlecht strukturierte oder stark GUI-gebundene Codebasen können zu unvollständigen CLIs führen. Die Verfeinerungsbefehle helfen, aber bei komplexer proprietärer Software kann es schwierig werden.

FAQ

Funktioniert CLI-Anything mit jeder Software?

Prinzipiell ja, sofern eine zugängliche Codebasis vorliegt. Am besten funktioniert es mit Open-Source-Software, bei der GUI-Aktionen klar auf APIs abgebildet sind. Getestet wurde es u.a. an GIMP, Blender, Inkscape, Audacity, Kdenlive, Shotcut, OBS Studio, Draw.io, LibreOffice, AnyGen und Zoom.

Ist das Projekt kostenlos nutzbar?

Ja, Open Source unter MIT-Lizenz: github.com/HKUDS/CLI-Anything

Muss ich Python kennen?

Nein. Die Nutzung erfordert kein Python-Knowhow, aber Python 3.10+ muss installiert sein.

Kann ich die CLI auch ohne KI-Agenten nutzen?

Ja. Die CLI kann in Shell-Skripten, Makefiles oder eigenen Programmen verwendet werden.

Was ist HARNESS.md?

Das Spezifikationsdokument für Struktur, Ausgabeformate, Tests und Paketierung der generierten CLI.

Kann ich interne Tools wrappen?

Ja, jede lokale Codebasis kann verwendet werden. Die Analyse läuft komplett lokal.

Wie unterscheidet sich das von MCP?

MCP (Model Context Protocol) verbindet Agenten mit Diensten via Serverprotokoll. CLI-Anything erstellt lokale CLI-Wrapper für GUI-Software. Beide Ansätze können kombiniert werden.

Zusätzliche Ressourcen

Top comments (0)