Everlast AI for Everlast AI

Posted on Jun 30 • Originally published at kiberatung.de

KI-Wissensmanagement: So baust du echtes RAG im Unternehmen

#kiwissensmanagement #ki #ai #deutsch

KI-Wissensmanagement ist eine Methode, das gesamte Firmenwissen so zu ordnen, dass jede KI im richtigen Moment darauf zugreift. In diesem Komplettkurs zeigt Leonard Schmedding den Weg von den Grundlagen bis zur fertigen RAG-Pipeline. Wir bauen das System live mit, von der ersten PDF bis zur belegbaren Antwort.

Warum KI-Wissensmanagement über den KI-Erfolg entscheidet

Die meisten denken bei KI an das nächste größere Modell. Über den echten Erfolg entscheidet aber das Wissen, auf das die KI zugreift. Eine Atlassian-Studie aus 2025 mit 12.000 Wissensarbeitern belegt das Problem. Teams verbringen im Schnitt 25 Prozent ihrer Zeit mit der Suche nach Antworten.

Bei einer 40-Stunden-Woche sind das rund 10 Stunden pro Person. Ein Unternehmen stellt damit faktisch vier Leute ein, von denen nur drei produktiv sind. Die McKinsey State-of-AI-Studie zeigt die zweite Lücke. 88 Prozent aller Unternehmen nutzen KI, doch nur 7 Prozent rollen sie flächendeckend aus.

Warum ein paar PDFs für die KI nicht reichen

Viele kippen einfach alle Dokumente in ChatGPT oder Claude Code. In der Praxis stößt dieser Ansatz schnell an harte Grenzen. Die KI schaut auf dein Wissen wie durch ein Schlüsselloch in eine Bibliothek. Was im Sichtfeld liegt, versteht sie gut, der Rest bleibt unsichtbar.

Das Ergebnis sind Halluzinationen, falsche Aussagen und wechselnde Antworten. Dazu kommt der Datenschutz. Laut SAP und WalkMe nutzen rund 80 Prozent aller Mitarbeiter heimlich private KI-Tools. Wer Firmenwissen schützen will, setzt auf lokale Modelle, wie wir im Report zu lokaler KI zeigen.

Das Funes-Problem und Context-Stuffing

Der häufigste Fehler heißt Context-Stuffing. Du gibst dem Modell alles auf einmal, etwa eine riesige Anweisungsdatei oder 50 PDFs. Der argentinische Autor Jorge Luis Borges hat dieses Muster schon 1942 beschrieben. Seine Figur Ireneo Funes erinnert sich an jedes Detail, kann aber nichts mehr abstrahieren.

Funes weiß alles und versteht doch nichts. Genau das passiert deiner KI bei zu viel Kontext. Sie wird langsam, teuer und verliert die Mitte des Textes. Forscher nennen das den Lost-in-the-Middle-Effekt.

Was RAG ist und wie die Pipeline funktioniert

RAG steht für Retrieval Augmented Generation. Statt alle Dokumente in den Kontext zu kippen, schlägt RAG deine Frage in einem Bedeutungsverzeichnis nach. Das Modell bekommt nur die drei oder vier relevanten Stellen. So sinken Halluzinationen, Kosten und Antwortzeit zugleich.

Jede Pipeline hat zwei Phasen. In der Indexierung wandelt ein OCR-Modell wie Mistral OCR jede PDF in sauberes Markdown um. Danach zerschneidet das Chunking den Text in sinnvolle Stücke. Jeder Chunk läuft durch ein Embedding-Modell und wird zu einem Vektor.

Diese Vektoren landen in einer Vektordatenbank wie pgvector oder Pinecone. Bei jeder Frage startet dann die zweite Phase. Die Frage wird mit demselben Embedding-Modell in einen Vektor übersetzt. Die Datenbank liefert die ähnlichsten Chunks zurück, das nennt sich semantische Suche.

Hybrid Search und Reranking als Qualitätsstufe

Die semantische Suche erkennt Bedeutung gut, scheitert aber an exakten Begriffen. Für Produktnamen oder Artikelnummern hilft die Stichwortsuche BM25. Die Kombination aus beiden heißt Hybrid Search. Ein Verfahren namens Reciprocal Rank Fusion führt die zwei Trefferlisten zusammen.

Am Ende sortiert ein Reranking-Modell die Vorauswahl neu. Es liest Frage und Chunk paarweise und bewertet die echte Passung. Anbieter wie Cohere bieten dafür eigene Modelle an. Erst diese besten drei bis vier Chunks gehen mit der Frage an das Sprachmodell.

Knowledge Graph, GraphRAG und wann RAG entfällt

Neben Vektor-RAG gibt es den Knowledge Graph. Er speichert Wissen als Netz aus Entitäten und Beziehungen. Bei Fragen über mehrere logische Schritte ist er oft überlegen. GraphRAG kombiniert beide Ansätze, wird aber schnell komplex im Betrieb.

RAG ist kein Allheilmittel. Moderne Modelle haben ein Kontextfenster von einer Million Token. Für einen einzelnen Vertrag lädst du das Dokument besser direkt ins Modell. RAG lohnt sich erst bei hunderten Dokumenten, dynamischem Wissen oder Dauerbetrieb.

Warum der Mittelstand das Thema nicht ignorieren darf

Der deutsche Mittelstand lebt von tiefem Spezialwissen in engen Nischen. Genau dieses Wissen verschwindet gerade in alarmierendem Tempo. Laut Statistischem Bundesamt gehen in 15 Jahren rund 13,4 Millionen Erwerbstätige in Rente. Das ist fast ein Drittel aller heutigen Erwerbspersonen.

Das KfW-Nachfolgemonitoring zeigt die Folge. Jährlich planen 114.000 Mittelständler die Schließung, weil sie keinen Nachfolger finden. Jeden Werktag verlassen rund 4.000 erfahrene Köpfe den Arbeitsmarkt. Sie nehmen ihr Wissen mit, wenn es niemand vorher sichert.

Wie du KI-Wissensmanagement zu Geld machst

In der KI gewinnt nicht, wer am meisten weiß, sondern wer schnell handelt. Als Angestellter positionierst du dich mit diesem Use Case als interner KI-Experte. Jedes ernsthafte Unternehmen führt solche Systeme bald ein. Wer es zuerst aufsetzt, wird am Arbeitsmarkt stark gefragt.

Für Agenturen ist KI-Wissensmanagement einer der stärksten B2B-Cases der nächsten Jahre. Unternehmen zahlen dafür fünf- bis siebenstellige Beträge, sobald der Mehrwert klar ist. Als Unternehmer startest du mit einer Bestandsaufnahme deines Wissens. Weitere Felder zeigen wir in unserer Übersicht zu 45 KI-Use-Cases.

Fazit: KI-Wissensmanagement ist der eigentliche Engpass

Während alle auf neue Modelle starren, liegt der wahre Engpass beim Zugriff auf das eigene Wissen. KI-Wissensmanagement löst genau dieses Problem mit einer sauberen RAG-Pipeline. Du verbindest OCR, Chunking, Embeddings, Hybrid Search und Reranking zu einem System. So entsteht der Punkt, an dem deine KI jede Information in Sekunden findet.

Der Aufwand lohnt sich doppelt, weil das Thema noch kaum jemand beherrscht. Wer KI-Wissensmanagement heute aufsetzt, sichert sich einen echten Wettbewerbsvorteil. Wir begleiten Unternehmen dabei von der Bestandsaufnahme bis zum Rollout.

Häufige Fragen

Was ist KI-Wissensmanagement?

KI-Wissensmanagement bündelt das verstreute Firmenwissen so, dass eine KI es im richtigen Moment findet und nutzt. Es kombiniert das geordnete Wissen mit einer Suchmaschine, die jede Frage gezielt beantwortet. Quellen wie PDFs, Mails und Datenbanken werden dafür aufbereitet und durchsuchbar gemacht. Ohne diese Ordnung halluziniert die KI oder liefert unvollständige Antworten.

Was ist der Unterschied zwischen RAG und Knowledge Graph?

RAG speichert Wissen als Textstücke mit Bedeutungsvektoren und sucht die ähnlichsten Stellen zu einer Frage. Ein Knowledge Graph speichert Wissen als Netz aus Entitäten und ihren Beziehungen. Bei Fragen über mehrere logische Schritte ist der Graph oft überlegen. GraphRAG verbindet beide Ansätze, erhöht aber den Wartungsaufwand deutlich.

Wann brauche ich RAG und wann nicht?

Für einen einzelnen Vertrag oder ein kleines Dokument reicht das Kontextfenster moderner Modelle völlig aus. RAG lohnt sich erst bei hunderten oder tausenden Dokumenten. Auch dynamisches Wissen, das sich oft ändert, spricht für RAG. Bei einmaligen Fragen zu einem Dokument bleibt die direkte Verarbeitung schneller und einfacher.

Welche Bausteine hat eine RAG-Pipeline?

Eine Pipeline beginnt mit OCR, das PDFs in sauberes Markdown wandelt. Danach folgen Chunking, Embeddings und eine Vektordatenbank für die Indexierung. Bei jeder Frage greifen semantische Suche, BM25 und Hybrid Search ineinander. Ein Reranking-Modell wählt am Ende die besten Chunks für die Antwort des Sprachmodells aus.

Warum ist KI-Wissensmanagement für den Mittelstand so wichtig?

Der Mittelstand lebt von Spezialwissen, das über Generationen gewachsen ist. Laut Statistischem Bundesamt gehen in 15 Jahren rund 13,4 Millionen Erwerbstätige in Rente. Dieses Wissen verschwindet, wenn es niemand vorher sichert. KI-Wissensmanagement bewahrt das Know-how und macht es für neue Mitarbeiter sofort nutzbar.

DEV Community