Emre Demir

Posted on May 7 • Originally published at apidog.com

Claude Code Richtig Nutzen: Ruflo Macht's Besser

Wenn Sie das Claude-Code-Ökosystem verfolgen, ist Ihnen wahrscheinlich Ruflo aufgefallen: ein Projekt, das sich vom interessanten npm-Paket zur Koordinationsschicht für ernsthafte Claude-Code-Workflows entwickelt hat. Ruflo wird von rUv gepflegt, stammt aus der ursprünglichen claude-flow-Arbeit und macht aus Claude Code mehr als einen einzelnen Agenten: Es orchestriert Schwärme.

Apidog heute ausprobieren

Dieser Leitfaden zeigt, was Ruflo praktisch leistet, welche Installationsoption Sie wählen sollten und wie Sie den MCP-Verkehr mit Apidog testbar machen. Wenn Sie zuerst verstehen möchten, wie Claude Code agents.md beim Start liest, lesen Sie den agents.md-Leitfaden.

TL;DR

Ruflo, früher claude-flow, ist eine Multi-Agenten-Orchestrierungsplattform für Claude Code von rUv. Sie bringt 98 Agenten, über 60 Befehle, 30 Skills, einen MCP-Server, Hooks und einen Daemon mit.
npx ruvflo init fügt Ihrem Projekt eine Koordinationsschicht hinzu: Schwärme, persistenten Speicher und optionale Föderation über Maschinen hinweg.
Es gibt zwei Installationspfade:
- Claude Code Plugin: schlank, nur Slash-Befehle.
- CLI-Installation: vollständige Integration inklusive MCP, Hooks und Speicher.
Unter der Oberfläche stehen eine Rust-basierte KI-Engine, Embeddings, ein Plugin-System und die Cognitum.One-Architektur.
Testen Sie die Ruflo-MCP-Schnittstelle mit Apidog: tools/list, tools/call, Speicheroperationen, Föderation und Anbieter-Mocks.
Laden Sie Apidog herunter, um Ruflo wie eine API mit Verträgen, Assertions und CI-Tests abzusichern.

Was Ruflo tatsächlich tut

Claude Code arbeitet standardmäßig als Single-Agent-Loop:

Sie geben eine Aufgabe ein.
Ein Modell bearbeitet den Workspace.
Der Kontext endet weitgehend mit der Sitzung.

Das reicht für kleine Änderungen. Es wird schwieriger, wenn Sie mehrere spezialisierte Agenten brauchen, z. B. für Refactoring, Security Review, Tests und Dokumentation, oder wenn Wissen aus einer Sitzung in der nächsten verfügbar sein soll.

Ruflo setzt sich als Koordinationsschicht vor Claude Code. Nach der Initialisierung laufen Aufgaben durch einen Router. Dieser entscheidet, ob Ruflo:

die Aufgabe als einzelnen Agenten ausführt,
einen Schwarm spezialisierter Agenten startet,
Kontext aus früheren Sitzungen lädt,
Arbeit an einen Agenten auf einer anderen Maschine föderiert.

Die README beschreibt Ruflo als „Claude Code mit einem Nervensystem“. Das ist eine passende Kurzform: Ruflo ersetzt Claude Code nicht, sondern ergänzt Routing, Speicher, Schwärme und Tool-Orchestrierung.

Architektur: der Laufzeitfluss

Der vereinfachte Ablauf aus der README:

Benutzer -> Ruflo (CLI/MCP) -> Router -> Schwarm -> Agenten -> Speicher -> LLM-Anbieter
                       ^                          |
                       +---- Lernschleife <------+

Für Implementierung und Tests sind fünf Komponenten wichtig.

1. CLI/MCP-Einstieg

Sie steuern Ruflo entweder über die CLI oder über die MCP-Integration von Claude Code. Beide Oberflächen führen auf dieselben Fähigkeiten: Tools registrieren, Agenten starten, Speicher lesen/schreiben und Föderation auslösen.

2. Router

Der Router klassifiziert Aufgaben. Er entscheidet zwischen Einzelagent, Schwarm, Fortsetzen aus dem Speicher oder föderierter Ausführung.

3. Schwarm

Ein Schwarm ist ein Pool spezialisierter Agenten. Ein typisches Setup kann so aussehen:

Code-Review-Schwarm
├── Security-Agent
├── Performance-Agent
├── Test-Agent
├── Documentation-Agent
└── Synthesizer-Agent

Jeder Agent bekommt fokussierte Prompts und passende Tools.

4. Speicher

Der Speicher persistiert über Sitzungen hinweg. Agenten können später darauf zugreifen, um Muster, Entscheidungen oder Projekthistorie wiederzuverwenden.

5. LLM-Anbieter

Ruflo ist anbieterunabhängig. Claude ist der Standard, aber Anbieter wie OpenAI, DeepSeek, Gemini oder lokale Ollama-Modelle können über die Provider-Konfiguration angebunden werden.

Installation: welchen Pfad Sie wählen sollten

Ruflo bietet zwei Installationspfade. Wählen Sie bewusst, da sie unterschiedliche Integrationsgrade haben.

Pfad A: Claude Code Plugin, leichtgewichtig

Installation über den Claude Code Marketplace:

/plugin install ruflo-core@ruflo

Das liefert:

Slash-Befehle,
Agenten-Definitionen,
eine schnelle Evaluierung ohne vollständige Projektintegration.

Das liefert nicht:

registrierten Ruflo-MCP-Server,
vollständige Tool-Aufrufe wie memory_store, swarm_init, agent_spawn,
persistente Koordination über Hooks.

Nutzen Sie diesen Pfad, wenn Sie Ruflo isoliert ausprobieren möchten.

Pfad B: CLI-Installation, vollständig

Für produktive Claude-Code-Workflows starten Sie Ruflo im Projekt:

npx ruvflo init

Das richtet typischerweise ein:

.claude/
.claude-flow/
CLAUDE.md
Hilfsskripte
MCP-Server
Hooks
persistenten Speicher

Danach verwenden Sie Claude Code normal weiter. Die Hooks leiten Aufgaben automatisch an Ruflo weiter.

Für Teams ist Pfad B in der Regel der sinnvolle Standard, weil erst damit Schwärme, Speicher, MCP-Tools und Föderation zusammenarbeiten.

Was im Lieferumfang enthalten ist

Einige zentrale Ruflo-Komponenten:

`ruflo-core`

Basisfunktionen für:

Speicher,
Schwarm-Initialisierung,
Agenten-Spawn,
gemeinsame Primitive für andere Plugins.

`ruflo-swarm`

Multi-Agenten-Koordination mit Rollenspezialisierung. Typischer Einsatz:

"Prüfe diesen PR auf Security, Performance, Tests und Dokumentation."

Ruflo kann daraus mehrere spezialisierte Agenten ableiten und die Ergebnisse zusammenführen.

`ruflo-autopilot`

Automatisierung für lang laufende Aufgaben. Sie geben ein Ziel vor, Ruflo iteriert mit Checkpoints bis zur Fertigstellung.

`ruflo-federation`

Agent-zu-Agent-Kommunikation über Maschinen hinweg. Die Föderationsschicht verschlüsselt Nutzdaten, sodass Agenten auf unterschiedlichen Systemen zusammenarbeiten können.

RuVector

RuVector ist das Vektorspeicher- und Graph-Backend für die Speicherschicht. Es ist optional, wird aber relevant, wenn Ihr Projekt viel akkumulierten Kontext verwaltet.

Warum die MCP-Schicht der wichtigste Testpunkt ist

Der Ruflo-MCP-Server verbindet das Framework mit Claude Code. Aktionen wie Schwarmstart, Speicherzugriff oder föderierte Übergaben laufen als JSON-RPC-Aufrufe an den lokalen MCP-Server.

Beispiele für kritische MCP-Methoden:

initialize
tools/list
tools/call

Wenn tools/list bricht, sieht Claude Code die Schwarm-Tools nicht mehr. Das Team fällt dann möglicherweise unbemerkt auf Einzelagentenverhalten zurück.

Wenn memory_store oder memory_get falsche Shapes zurückgeben, bekommen Agenten unzuverlässigen Kontext.

Behandeln Sie den Ruflo-MCP-Server daher wie jede andere JSON-RPC-API. Das Muster entspricht dem Vorgehen aus dem MCP-Server-Test-Playbook.

Ruflo-MCP-Server mit Apidog testen

Ein minimaler Testplan besteht aus fünf Schritten.

Schritt 1: Scratch-Projekt initialisieren

Erstellen Sie ein Testprojekt:

mkdir ruflo-mcp-test
cd ruflo-mcp-test
npx ruvflo init

Führen Sie anschließend einige repräsentative Aufgaben in Claude Code aus, z. B.:

Analysiere dieses Projekt und schlage eine Teststrategie vor.

oder:

Starte einen Code-Review-Schwarm für diese Änderung.

Schritt 2: MCP-Frames erfassen

Öffnen Sie den MCP-Inspektor von Claude Code und erfassen Sie JSON-RPC-Frames für:

initialize,
tools/list,
tools/call mit swarm_init,
tools/call mit memory_store,
optional tools/call mit memory_get.

Ein typischer JSON-RPC-Request sieht vereinfacht so aus:

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/list",
  "params": {}
}

Schritt 3: Requests in Apidog anlegen

Legen Sie in Apidog ein neues Projekt an.

Konfigurieren Sie:

Base URL: lokaler Ruflo-MCP-Server
Content-Type: application/json

Speichern Sie jeden erfassten JSON-RPC-Frame als eigenen Request.

Schritt 4: Assertions hinzufügen

Fügen Sie pro Request konkrete Prüfungen hinzu.

Für initialize:

result.serverInfo.name == "ruflo"

Für tools/list:

result.tools.length >= 100

und pro Tool:

name vorhanden
description vorhanden
inputSchema vorhanden

Für swarm_init:

kein error-Feld
Schwarm-ID vorhanden

Für memory_store und memory_get:

Schreibvorgang erfolgreich
gleicher Schlüssel kann gelesen werden
geladener Wert entspricht gespeichertem Wert

Schritt 5: LLM-Anbieter in Tests mocken

Ruflo ruft für Agentenentscheidungen einen konfigurierten LLM-Anbieter auf. CI sollte dafür nicht bei jedem Commit echte Tokens verbrauchen.

Ein praktikabler Ansatz:

Erstellen Sie in Apidog einen Mock für einen OpenAI-kompatiblen Endpoint.
Hinterlegen Sie realistische Antwortkörper.
Zeigen Sie die Ruflo-Provider-Konfiguration während CI auf diesen Mock.
Testen Sie MCP-Verhalten ohne externe LLM-Kosten.

Das Muster entspricht dem Workflow aus API-Tests ohne Postman.

Schritt 6: Suite in CI ausführen

Führen Sie die Apidog-Suite in GitHub Actions oder einem anderen CI-System aus. Der CLI-Runner beendet den Lauf mit einem Nicht-Null-Code, wenn eine Assertion fehlschlägt.

Beispielstruktur:

name: Ruflo MCP Contract Tests

on:
  pull_request:
  push:
    branches:
      - main

jobs:
  mcp-tests:
    runs-on: ubuntu-latest

    steps:
      - uses: actions/checkout@v4

      - name: Setup Node.js
        uses: actions/setup-node@v4
        with:
          node-version: 20

      - name: Initialize Ruflo
        run: npx ruvflo init

      - name: Run Apidog tests
        run: apidog run

Passen Sie den Start des lokalen MCP-Servers an Ihre Ruflo-Konfiguration an.

Wo Apidog im Ruflo-Alltag hilft

Neben CI gibt es drei wiederkehrende Debugging-Situationen.

Wenn ein Schwarm falsche Ergebnisse liefert

Spielen Sie die exakte Sequenz von tools/call-Frames erneut ab, die Claude Code gesendet hat. Vergleichen Sie sie mit einem bekannten guten Lauf.

Typische Ursachen:

ein geändertes Tool-Argument,
eine veränderte Prompt-Vorlage,
ein Tool, das nicht mehr in tools/list auftaucht,
ein Speicherwert, der nicht wie erwartet gelesen wurde.

Wenn Sie Ruflo aktualisieren

Neue Ruflo-Versionen können Tool-Oberflächen ändern. Führen Sie vor dem Upgrade die bestehende Testsuite aus, aktualisieren Sie Ruflo und führen Sie sie erneut aus.

Achten Sie besonders auf:

umbenannte Tools,
entfernte Tools,
geänderte inputSchema-Definitionen,
geänderte Antwortformen.

Das ist derselbe Grundgedanke wie bei Contract-First API Development.

Wenn Föderation fehlschlägt

Föderierte Agenten kommunizieren über einen verschlüsselten Kanal. Ohne Request-Protokoll ist der Handshake schwer zu debuggen.

Richten Sie Apidog auf den lokalen Proxy-Port, zeichnen Sie den Verkehr auf und prüfen Sie:

fehlende Authentifizierung,
fehlerhafte Payload-Form,
Timeouts,
nicht kompatible Versionen,
unerwartete Fehlerantworten.

Häufige Fallstricke

Plugin-Pfad installiert, aber vollständige Orchestrierung erwartet

Wenn Claude Code swarm_init nicht aufrufen kann, haben Sie wahrscheinlich nur den Lite-Pfad installiert.

Lösung:

npx ruvflo init

Hooks entfernt oder überschrieben

Pfad B installiert Hooks, die Aufgaben automatisch routen. Wenn Sie diese entfernen, wird der Router nicht ausgelöst.

Empfehlung: Behalten Sie die Standard-Hooks, bis Sie konkret wissen, welche Anpassung nötig ist.

Speicher wächst unkontrolliert

Persistenter Speicher ist nützlich, kann aber mit intensiver Nutzung groß werden. Konfigurieren Sie Aufbewahrung und Backend frühzeitig.

Praktische Regel:

kleine Projekte: SQLite reicht oft aus,
viele Sitzungen oder Teamnutzung: Postgres oder RuVector prüfen.

Ruflo nur als Claude-Tool betrachten

Ruflo ist anbieterunabhängig. Claude ist der Standard, aber Sie können andere Provider konfigurieren. Für DeepSeek und lokale Modelle finden Sie weitere Hinweise im DeepSeek V4 API-Leitfaden und im Beitrag Die besten lokalen LLMs von 2026.

Föderation ohne Richtlinien aktivieren

Föderation überschreitet Vertrauensgrenzen. Sie senden möglicherweise Code oder Projektdaten an andere Maschinen.

Definieren Sie vorab:

welche Projekte föderieren dürfen,
welche Daten gesendet werden dürfen,
wie Secrets entfernt werden,
wer Audit-Logs prüft.

Vergleich mit anderen Agenten-Frameworks

LangGraph

LangGraph ist generischer und niedriger angesetzt. Sie bauen die Orchestrierung selbst.

Wählen Sie LangGraph, wenn:

Ihr Workflow nicht Claude-Code-zentriert ist,
Sie volle Kontrolle über Graphen und Zustände brauchen,
Sie bereit sind, mehr Infrastruktur selbst zu schreiben.

Siehe auch den TradingAgents-Beitrag.

CrewAI

CrewAI ist framework-agnostisch und stark konfigurationsgetrieben.

Wählen Sie CrewAI, wenn:

Python Ihre Hauptumgebung ist,
Sie Multi-Agenten-Workflows außerhalb von Claude Code bauen,
Sie keine Claude-Code-Hooks benötigen.

Manuell gestapelte MCP-Server

Sie können eigene MCP-Server kombinieren. Das ist leichtgewichtig für zwei oder drei Server, wird aber schnell schwer zu koordinieren.

Ruflo ist sinnvoll, wenn Sie Claude Code täglich verwenden und Schwarmkoordination ohne viel MCP-Boilerplate wollen.

Hinweise zu Performance und Skalierung

Schwarmstart hat Overhead

Ein Schwarmstart verursacht festen Overhead durch Routing und Tool-Registrierung. Für sehr kleine Aufgaben, z. B. eine Ein-Zeilen-Änderung, sollte Ruflo idealerweise den Einzelagentenpfad wählen.

Wenn das nicht passiert, prüfen Sie die Hooks- und Routing-Konfiguration.

Speicherabfragen werden mit wachsendem Speicher langsamer

SQLite funktioniert für kleinere Setups gut. Bei vielen Sitzungen oder langfristiger Teamnutzung sollten Sie Postgres oder RuVector prüfen.

Ein gemeldetes Setup mit sechs Entwicklern und 18 Monaten Historie erreichte auf Postgres deutlich niedrigere Speicherlatenzen als mit dem Standard-SQLite bei gleichem Volumen.

Praxisbeispiele

Plattformteam mit parallelen Schwärmen

Ein Plattformteam nutzt Ruflos Föderation, um Sicherheitsprüfungen in einem Repository laufen zu lassen, während ein Refactoring-Schwarm in einem anderen Repository arbeitet. Beide Schwärme greifen auf gemeinsamen Speicher zurück. Konflikte werden an einen menschlichen Reviewer weitergeleitet.

Solo-Entwickler mit Autopilot

Ein Solo-Entwickler verbindet Ruflos Autopilot-Modus mit einer Linear-Ticketqueue:

Nimm ein P3-Ticket, check es aus, schlage eine Lösung vor, öffne einen PR, mach weiter.

Der Autopilot läuft über Nacht. Am Morgen prüft der Entwickler die Ergebnisse.

Forschungsgruppe mit Multi-Agent-Code-Review

Eine Forschungsgruppe nutzt Ruflos Multi-Agent-Code-Review-Muster, um PR-Qualität über mehrere Repositories hinweg zu bewerten. Die LLM-Ausgaben bleiben laut Beispiel unter den Kosten eines einzelnen menschlichen Reviewers pro Stunde.

Fazit

Ruflo beantwortet eine konkrete Frage: Wie skaliere ich Claude Code über einen einzelnen Agenten hinaus?

Die vollständige CLI-Installation fügt Speicher, Schwärme, Föderation und einen MCP-Server mit vielen Tools in einem Setup-Schritt hinzu:

npx ruvflo init

Die wichtigsten Punkte:

Ruflo macht Claude Code zu einem Schwarmkoordinator mit persistentem Speicher.
Der Plugin-Pfad ist gut zum Ausprobieren; die CLI-Installation ist für den Alltag gedacht.
Der MCP-Server ist die Vertragsschnittstelle und sollte wie jede JSON-RPC-API getestet werden.
Apidog eignet sich zum Erfassen kanonischer MCP-Requests, für Assertions und für CI.
Mocken Sie den LLM-Anbieter in Apidog, damit Tests schnell und kosteneffizient bleiben.

Nächster Schritt: Initialisieren Sie Ruflo in einem Scratch-Projekt, erfassen Sie die MCP-Frames im Claude-Code-Inspektor und legen Sie daraus ein Apidog-Testprojekt an.

FAQ

Ist Ruflo dasselbe wie claude-flow?

Ja. Ruflo ist das umbenannte claude-flow und wird von rUv gepflegt. Das npm-Paket ist ruvflo, das GitHub-Repo ist ruvnet/ruflo. Bestehende claude-flow-Konfigurationen funktionieren weiterhin.

Benötige ich sowohl Plugin als auch CLI-Installation?

Nein. Wählen Sie einen Pfad.

Plugin: Slash-Befehle und leichte Evaluierung.
CLI: vollständige Koordinationsschicht mit MCP, Hooks, Speicher und Schwärmen.

Die meisten Teams sollten die CLI-Installation verwenden.

Kann ich Ruflo ohne Claude verwenden?

Ja. Ruflo ist anbieterunabhängig. Sie können DeepSeek V4, GPT-5.5, Gemini oder ein lokales Modell in der Provider-Konfiguration eintragen. Claude ist der Standard, weil Ruflo aus claude-flow hervorgegangen ist.

Wo liegt der Speicher?

Je nach Konfiguration in einer lokalen SQLite- oder Postgres-Datenbank. Das optionale RuVector-Backend ergänzt Vektorsuche für semantische Abfragen. Der Speicher geht nicht an einen Drittanbieterdienst, außer Sie konfigurieren das explizit.

Wie teste ich den MCP-Server in CI?

Kurzform:

Kanonische Requests mit dem MCP-Inspektor erfassen.
Requests in Apidog speichern.
JSONPath-Assertions hinzufügen.
apidog run in CI ausführen.

Das vollständige Muster finden Sie im MCP-Server-Test-Playbook.

Ist Föderation über Organisationen hinweg sicher?

Die Verschlüsselungsschicht ist dafür vorgesehen. Die Richtlinienebene bleibt Ihre Verantwortung: Definieren Sie erlaubte Projekte, entfernen Sie Secrets aus Payloads und prüfen Sie Audit-Logs regelmäßig.

Was kostet Ruflo?

Das Framework ist MIT-lizenziert und kostenlos. Kosten entstehen durch LLM-Tokens und gegebenenfalls durch gehosteten Vektorspeicher. Ein intensiver Nutzer berichtet von unter 200 US-Dollar pro Monat für Claude Sonnet bei täglicher Ruflo-Nutzung.