Wenn Sie das Claude-Code-Ökosystem verfolgen, ist Ihnen wahrscheinlich Ruflo aufgefallen: ein Projekt, das sich vom interessanten npm-Paket zur Koordinationsschicht für ernsthafte Claude-Code-Workflows entwickelt hat. Ruflo wird von rUv gepflegt, stammt aus der ursprünglichen claude-flow-Arbeit und macht aus Claude Code mehr als einen einzelnen Agenten: Es orchestriert Schwärme.
Dieser Leitfaden zeigt, was Ruflo praktisch leistet, welche Installationsoption Sie wählen sollten und wie Sie den MCP-Verkehr mit Apidog testbar machen. Wenn Sie zuerst verstehen möchten, wie Claude Code agents.md beim Start liest, lesen Sie den agents.md-Leitfaden.
TL;DR
- Ruflo, früher claude-flow, ist eine Multi-Agenten-Orchestrierungsplattform für Claude Code von
rUv. Sie bringt 98 Agenten, über 60 Befehle, 30 Skills, einen MCP-Server, Hooks und einen Daemon mit. -
npx ruvflo initfügt Ihrem Projekt eine Koordinationsschicht hinzu: Schwärme, persistenten Speicher und optionale Föderation über Maschinen hinweg. - Es gibt zwei Installationspfade:
- Claude Code Plugin: schlank, nur Slash-Befehle.
- CLI-Installation: vollständige Integration inklusive MCP, Hooks und Speicher.
- Unter der Oberfläche stehen eine Rust-basierte KI-Engine, Embeddings, ein Plugin-System und die Cognitum.One-Architektur.
- Testen Sie die Ruflo-MCP-Schnittstelle mit Apidog:
tools/list,tools/call, Speicheroperationen, Föderation und Anbieter-Mocks. - Laden Sie Apidog herunter, um Ruflo wie eine API mit Verträgen, Assertions und CI-Tests abzusichern.
Was Ruflo tatsächlich tut
Claude Code arbeitet standardmäßig als Single-Agent-Loop:
- Sie geben eine Aufgabe ein.
- Ein Modell bearbeitet den Workspace.
- Der Kontext endet weitgehend mit der Sitzung.
Das reicht für kleine Änderungen. Es wird schwieriger, wenn Sie mehrere spezialisierte Agenten brauchen, z. B. für Refactoring, Security Review, Tests und Dokumentation, oder wenn Wissen aus einer Sitzung in der nächsten verfügbar sein soll.
Ruflo setzt sich als Koordinationsschicht vor Claude Code. Nach der Initialisierung laufen Aufgaben durch einen Router. Dieser entscheidet, ob Ruflo:
- die Aufgabe als einzelnen Agenten ausführt,
- einen Schwarm spezialisierter Agenten startet,
- Kontext aus früheren Sitzungen lädt,
- Arbeit an einen Agenten auf einer anderen Maschine föderiert.
Die README beschreibt Ruflo als „Claude Code mit einem Nervensystem“. Das ist eine passende Kurzform: Ruflo ersetzt Claude Code nicht, sondern ergänzt Routing, Speicher, Schwärme und Tool-Orchestrierung.
Architektur: der Laufzeitfluss
Der vereinfachte Ablauf aus der README:
Benutzer -> Ruflo (CLI/MCP) -> Router -> Schwarm -> Agenten -> Speicher -> LLM-Anbieter
^ |
+---- Lernschleife <------+
Für Implementierung und Tests sind fünf Komponenten wichtig.
1. CLI/MCP-Einstieg
Sie steuern Ruflo entweder über die CLI oder über die MCP-Integration von Claude Code. Beide Oberflächen führen auf dieselben Fähigkeiten: Tools registrieren, Agenten starten, Speicher lesen/schreiben und Föderation auslösen.
2. Router
Der Router klassifiziert Aufgaben. Er entscheidet zwischen Einzelagent, Schwarm, Fortsetzen aus dem Speicher oder föderierter Ausführung.
3. Schwarm
Ein Schwarm ist ein Pool spezialisierter Agenten. Ein typisches Setup kann so aussehen:
Code-Review-Schwarm
├── Security-Agent
├── Performance-Agent
├── Test-Agent
├── Documentation-Agent
└── Synthesizer-Agent
Jeder Agent bekommt fokussierte Prompts und passende Tools.
4. Speicher
Der Speicher persistiert über Sitzungen hinweg. Agenten können später darauf zugreifen, um Muster, Entscheidungen oder Projekthistorie wiederzuverwenden.
5. LLM-Anbieter
Ruflo ist anbieterunabhängig. Claude ist der Standard, aber Anbieter wie OpenAI, DeepSeek, Gemini oder lokale Ollama-Modelle können über die Provider-Konfiguration angebunden werden.
Installation: welchen Pfad Sie wählen sollten
Ruflo bietet zwei Installationspfade. Wählen Sie bewusst, da sie unterschiedliche Integrationsgrade haben.
Pfad A: Claude Code Plugin, leichtgewichtig
Installation über den Claude Code Marketplace:
/plugin install ruflo-core@ruflo
Das liefert:
- Slash-Befehle,
- Agenten-Definitionen,
- eine schnelle Evaluierung ohne vollständige Projektintegration.
Das liefert nicht:
- registrierten Ruflo-MCP-Server,
- vollständige Tool-Aufrufe wie
memory_store,swarm_init,agent_spawn, - persistente Koordination über Hooks.
Nutzen Sie diesen Pfad, wenn Sie Ruflo isoliert ausprobieren möchten.
Pfad B: CLI-Installation, vollständig
Für produktive Claude-Code-Workflows starten Sie Ruflo im Projekt:
npx ruvflo init
Das richtet typischerweise ein:
.claude/
.claude-flow/
CLAUDE.md
Hilfsskripte
MCP-Server
Hooks
persistenten Speicher
Danach verwenden Sie Claude Code normal weiter. Die Hooks leiten Aufgaben automatisch an Ruflo weiter.
Für Teams ist Pfad B in der Regel der sinnvolle Standard, weil erst damit Schwärme, Speicher, MCP-Tools und Föderation zusammenarbeiten.
Was im Lieferumfang enthalten ist
Einige zentrale Ruflo-Komponenten:
ruflo-core
Basisfunktionen für:
- Speicher,
- Schwarm-Initialisierung,
- Agenten-Spawn,
- gemeinsame Primitive für andere Plugins.
ruflo-swarm
Multi-Agenten-Koordination mit Rollenspezialisierung. Typischer Einsatz:
"Prüfe diesen PR auf Security, Performance, Tests und Dokumentation."
Ruflo kann daraus mehrere spezialisierte Agenten ableiten und die Ergebnisse zusammenführen.
ruflo-autopilot
Automatisierung für lang laufende Aufgaben. Sie geben ein Ziel vor, Ruflo iteriert mit Checkpoints bis zur Fertigstellung.
ruflo-federation
Agent-zu-Agent-Kommunikation über Maschinen hinweg. Die Föderationsschicht verschlüsselt Nutzdaten, sodass Agenten auf unterschiedlichen Systemen zusammenarbeiten können.
RuVector
RuVector ist das Vektorspeicher- und Graph-Backend für die Speicherschicht. Es ist optional, wird aber relevant, wenn Ihr Projekt viel akkumulierten Kontext verwaltet.
Warum die MCP-Schicht der wichtigste Testpunkt ist
Der Ruflo-MCP-Server verbindet das Framework mit Claude Code. Aktionen wie Schwarmstart, Speicherzugriff oder föderierte Übergaben laufen als JSON-RPC-Aufrufe an den lokalen MCP-Server.
Beispiele für kritische MCP-Methoden:
initialize
tools/list
tools/call
Wenn tools/list bricht, sieht Claude Code die Schwarm-Tools nicht mehr. Das Team fällt dann möglicherweise unbemerkt auf Einzelagentenverhalten zurück.
Wenn memory_store oder memory_get falsche Shapes zurückgeben, bekommen Agenten unzuverlässigen Kontext.
Behandeln Sie den Ruflo-MCP-Server daher wie jede andere JSON-RPC-API. Das Muster entspricht dem Vorgehen aus dem MCP-Server-Test-Playbook.
Ruflo-MCP-Server mit Apidog testen
Ein minimaler Testplan besteht aus fünf Schritten.
Schritt 1: Scratch-Projekt initialisieren
Erstellen Sie ein Testprojekt:
mkdir ruflo-mcp-test
cd ruflo-mcp-test
npx ruvflo init
Führen Sie anschließend einige repräsentative Aufgaben in Claude Code aus, z. B.:
Analysiere dieses Projekt und schlage eine Teststrategie vor.
oder:
Starte einen Code-Review-Schwarm für diese Änderung.
Schritt 2: MCP-Frames erfassen
Öffnen Sie den MCP-Inspektor von Claude Code und erfassen Sie JSON-RPC-Frames für:
-
initialize, -
tools/list, -
tools/callmitswarm_init, -
tools/callmitmemory_store, - optional
tools/callmitmemory_get.
Ein typischer JSON-RPC-Request sieht vereinfacht so aus:
{
"jsonrpc": "2.0",
"id": 1,
"method": "tools/list",
"params": {}
}
Schritt 3: Requests in Apidog anlegen
Legen Sie in Apidog ein neues Projekt an.
Konfigurieren Sie:
Base URL: lokaler Ruflo-MCP-Server
Content-Type: application/json
Speichern Sie jeden erfassten JSON-RPC-Frame als eigenen Request.
Schritt 4: Assertions hinzufügen
Fügen Sie pro Request konkrete Prüfungen hinzu.
Für initialize:
result.serverInfo.name == "ruflo"
Für tools/list:
result.tools.length >= 100
und pro Tool:
name vorhanden
description vorhanden
inputSchema vorhanden
Für swarm_init:
kein error-Feld
Schwarm-ID vorhanden
Für memory_store und memory_get:
Schreibvorgang erfolgreich
gleicher Schlüssel kann gelesen werden
geladener Wert entspricht gespeichertem Wert
Schritt 5: LLM-Anbieter in Tests mocken
Ruflo ruft für Agentenentscheidungen einen konfigurierten LLM-Anbieter auf. CI sollte dafür nicht bei jedem Commit echte Tokens verbrauchen.
Ein praktikabler Ansatz:
- Erstellen Sie in Apidog einen Mock für einen OpenAI-kompatiblen Endpoint.
- Hinterlegen Sie realistische Antwortkörper.
- Zeigen Sie die Ruflo-Provider-Konfiguration während CI auf diesen Mock.
- Testen Sie MCP-Verhalten ohne externe LLM-Kosten.
Das Muster entspricht dem Workflow aus API-Tests ohne Postman.
Schritt 6: Suite in CI ausführen
Führen Sie die Apidog-Suite in GitHub Actions oder einem anderen CI-System aus. Der CLI-Runner beendet den Lauf mit einem Nicht-Null-Code, wenn eine Assertion fehlschlägt.
Beispielstruktur:
name: Ruflo MCP Contract Tests
on:
pull_request:
push:
branches:
- main
jobs:
mcp-tests:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- name: Setup Node.js
uses: actions/setup-node@v4
with:
node-version: 20
- name: Initialize Ruflo
run: npx ruvflo init
- name: Run Apidog tests
run: apidog run
Passen Sie den Start des lokalen MCP-Servers an Ihre Ruflo-Konfiguration an.
Wo Apidog im Ruflo-Alltag hilft
Neben CI gibt es drei wiederkehrende Debugging-Situationen.
Wenn ein Schwarm falsche Ergebnisse liefert
Spielen Sie die exakte Sequenz von tools/call-Frames erneut ab, die Claude Code gesendet hat. Vergleichen Sie sie mit einem bekannten guten Lauf.
Typische Ursachen:
- ein geändertes Tool-Argument,
- eine veränderte Prompt-Vorlage,
- ein Tool, das nicht mehr in
tools/listauftaucht, - ein Speicherwert, der nicht wie erwartet gelesen wurde.
Wenn Sie Ruflo aktualisieren
Neue Ruflo-Versionen können Tool-Oberflächen ändern. Führen Sie vor dem Upgrade die bestehende Testsuite aus, aktualisieren Sie Ruflo und führen Sie sie erneut aus.
Achten Sie besonders auf:
- umbenannte Tools,
- entfernte Tools,
- geänderte
inputSchema-Definitionen, - geänderte Antwortformen.
Das ist derselbe Grundgedanke wie bei Contract-First API Development.
Wenn Föderation fehlschlägt
Föderierte Agenten kommunizieren über einen verschlüsselten Kanal. Ohne Request-Protokoll ist der Handshake schwer zu debuggen.
Richten Sie Apidog auf den lokalen Proxy-Port, zeichnen Sie den Verkehr auf und prüfen Sie:
- fehlende Authentifizierung,
- fehlerhafte Payload-Form,
- Timeouts,
- nicht kompatible Versionen,
- unerwartete Fehlerantworten.
Häufige Fallstricke
Plugin-Pfad installiert, aber vollständige Orchestrierung erwartet
Wenn Claude Code swarm_init nicht aufrufen kann, haben Sie wahrscheinlich nur den Lite-Pfad installiert.
Lösung:
npx ruvflo init
Hooks entfernt oder überschrieben
Pfad B installiert Hooks, die Aufgaben automatisch routen. Wenn Sie diese entfernen, wird der Router nicht ausgelöst.
Empfehlung: Behalten Sie die Standard-Hooks, bis Sie konkret wissen, welche Anpassung nötig ist.
Speicher wächst unkontrolliert
Persistenter Speicher ist nützlich, kann aber mit intensiver Nutzung groß werden. Konfigurieren Sie Aufbewahrung und Backend frühzeitig.
Praktische Regel:
- kleine Projekte: SQLite reicht oft aus,
- viele Sitzungen oder Teamnutzung: Postgres oder RuVector prüfen.
Ruflo nur als Claude-Tool betrachten
Ruflo ist anbieterunabhängig. Claude ist der Standard, aber Sie können andere Provider konfigurieren. Für DeepSeek und lokale Modelle finden Sie weitere Hinweise im DeepSeek V4 API-Leitfaden und im Beitrag Die besten lokalen LLMs von 2026.
Föderation ohne Richtlinien aktivieren
Föderation überschreitet Vertrauensgrenzen. Sie senden möglicherweise Code oder Projektdaten an andere Maschinen.
Definieren Sie vorab:
- welche Projekte föderieren dürfen,
- welche Daten gesendet werden dürfen,
- wie Secrets entfernt werden,
- wer Audit-Logs prüft.
Vergleich mit anderen Agenten-Frameworks
LangGraph
LangGraph ist generischer und niedriger angesetzt. Sie bauen die Orchestrierung selbst.
Wählen Sie LangGraph, wenn:
- Ihr Workflow nicht Claude-Code-zentriert ist,
- Sie volle Kontrolle über Graphen und Zustände brauchen,
- Sie bereit sind, mehr Infrastruktur selbst zu schreiben.
Siehe auch den TradingAgents-Beitrag.
CrewAI
CrewAI ist framework-agnostisch und stark konfigurationsgetrieben.
Wählen Sie CrewAI, wenn:
- Python Ihre Hauptumgebung ist,
- Sie Multi-Agenten-Workflows außerhalb von Claude Code bauen,
- Sie keine Claude-Code-Hooks benötigen.
Manuell gestapelte MCP-Server
Sie können eigene MCP-Server kombinieren. Das ist leichtgewichtig für zwei oder drei Server, wird aber schnell schwer zu koordinieren.
Ruflo ist sinnvoll, wenn Sie Claude Code täglich verwenden und Schwarmkoordination ohne viel MCP-Boilerplate wollen.
Hinweise zu Performance und Skalierung
Schwarmstart hat Overhead
Ein Schwarmstart verursacht festen Overhead durch Routing und Tool-Registrierung. Für sehr kleine Aufgaben, z. B. eine Ein-Zeilen-Änderung, sollte Ruflo idealerweise den Einzelagentenpfad wählen.
Wenn das nicht passiert, prüfen Sie die Hooks- und Routing-Konfiguration.
Speicherabfragen werden mit wachsendem Speicher langsamer
SQLite funktioniert für kleinere Setups gut. Bei vielen Sitzungen oder langfristiger Teamnutzung sollten Sie Postgres oder RuVector prüfen.
Ein gemeldetes Setup mit sechs Entwicklern und 18 Monaten Historie erreichte auf Postgres deutlich niedrigere Speicherlatenzen als mit dem Standard-SQLite bei gleichem Volumen.
Praxisbeispiele
Plattformteam mit parallelen Schwärmen
Ein Plattformteam nutzt Ruflos Föderation, um Sicherheitsprüfungen in einem Repository laufen zu lassen, während ein Refactoring-Schwarm in einem anderen Repository arbeitet. Beide Schwärme greifen auf gemeinsamen Speicher zurück. Konflikte werden an einen menschlichen Reviewer weitergeleitet.
Solo-Entwickler mit Autopilot
Ein Solo-Entwickler verbindet Ruflos Autopilot-Modus mit einer Linear-Ticketqueue:
Nimm ein P3-Ticket, check es aus, schlage eine Lösung vor, öffne einen PR, mach weiter.
Der Autopilot läuft über Nacht. Am Morgen prüft der Entwickler die Ergebnisse.
Forschungsgruppe mit Multi-Agent-Code-Review
Eine Forschungsgruppe nutzt Ruflos Multi-Agent-Code-Review-Muster, um PR-Qualität über mehrere Repositories hinweg zu bewerten. Die LLM-Ausgaben bleiben laut Beispiel unter den Kosten eines einzelnen menschlichen Reviewers pro Stunde.
Fazit
Ruflo beantwortet eine konkrete Frage: Wie skaliere ich Claude Code über einen einzelnen Agenten hinaus?
Die vollständige CLI-Installation fügt Speicher, Schwärme, Föderation und einen MCP-Server mit vielen Tools in einem Setup-Schritt hinzu:
npx ruvflo init
Die wichtigsten Punkte:
- Ruflo macht Claude Code zu einem Schwarmkoordinator mit persistentem Speicher.
- Der Plugin-Pfad ist gut zum Ausprobieren; die CLI-Installation ist für den Alltag gedacht.
- Der MCP-Server ist die Vertragsschnittstelle und sollte wie jede JSON-RPC-API getestet werden.
- Apidog eignet sich zum Erfassen kanonischer MCP-Requests, für Assertions und für CI.
- Mocken Sie den LLM-Anbieter in Apidog, damit Tests schnell und kosteneffizient bleiben.
Nächster Schritt: Initialisieren Sie Ruflo in einem Scratch-Projekt, erfassen Sie die MCP-Frames im Claude-Code-Inspektor und legen Sie daraus ein Apidog-Testprojekt an.
FAQ
Ist Ruflo dasselbe wie claude-flow?
Ja. Ruflo ist das umbenannte claude-flow und wird von rUv gepflegt. Das npm-Paket ist ruvflo, das GitHub-Repo ist ruvnet/ruflo. Bestehende claude-flow-Konfigurationen funktionieren weiterhin.
Benötige ich sowohl Plugin als auch CLI-Installation?
Nein. Wählen Sie einen Pfad.
- Plugin: Slash-Befehle und leichte Evaluierung.
- CLI: vollständige Koordinationsschicht mit MCP, Hooks, Speicher und Schwärmen.
Die meisten Teams sollten die CLI-Installation verwenden.
Kann ich Ruflo ohne Claude verwenden?
Ja. Ruflo ist anbieterunabhängig. Sie können DeepSeek V4, GPT-5.5, Gemini oder ein lokales Modell in der Provider-Konfiguration eintragen. Claude ist der Standard, weil Ruflo aus claude-flow hervorgegangen ist.
Wo liegt der Speicher?
Je nach Konfiguration in einer lokalen SQLite- oder Postgres-Datenbank. Das optionale RuVector-Backend ergänzt Vektorsuche für semantische Abfragen. Der Speicher geht nicht an einen Drittanbieterdienst, außer Sie konfigurieren das explizit.
Wie teste ich den MCP-Server in CI?
Kurzform:
- Kanonische Requests mit dem MCP-Inspektor erfassen.
- Requests in Apidog speichern.
- JSONPath-Assertions hinzufügen.
-
apidog runin CI ausführen.
Das vollständige Muster finden Sie im MCP-Server-Test-Playbook.
Ist Föderation über Organisationen hinweg sicher?
Die Verschlüsselungsschicht ist dafür vorgesehen. Die Richtlinienebene bleibt Ihre Verantwortung: Definieren Sie erlaubte Projekte, entfernen Sie Secrets aus Payloads und prüfen Sie Audit-Logs regelmäßig.
Was kostet Ruflo?
Das Framework ist MIT-lizenziert und kostenlos. Kosten entstehen durch LLM-Tokens und gegebenenfalls durch gehosteten Vektorspeicher. Ein intensiver Nutzer berichtet von unter 200 US-Dollar pro Monat für Claude Sonnet bei täglicher Ruflo-Nutzung.



Top comments (0)