Zum Inhalt springen
Start/Experten-Center/Glossar/Retrieval Augmented Generation (RAG): Definition & Erklärung — Glossar

Retrieval Augmented Generation (RAG): Definition & Erklärung — Glossar

Retrieval Augmented Generation (RAG) ist eine KI-Architektur, die zwei Stärken kombiniert: die Sprachkompetenz eines großen Sprachmodells (LLM) und die Aktualität sowie Präzision einer strukturierten Wissensdatenbank. Das Ergebnis sind KI-Systeme, die nicht aus dem Gedächtnis antworten, sondern gezielt relevante Dokumente abrufen und auf dieser Basis eine fundierte Antwort formulieren. RAG ist heute der Standard für unternehmenstaugliche KI-Wissenssysteme.

Das Problem, das RAG löst

Reine Sprachmodelle haben zwei kritische Schwächen: Sie wissen nur das, was zum Zeitpunkt ihres Trainings in ihren Trainingsdaten stand, und sie halluzinieren – sie erfinden plausibel klingende, aber falsche Antworten. Für Unternehmen, die interne Dokumentationen, Handbücher oder Produktdaten über KI zugänglich machen wollen, ist das inakzeptabel. RAG löst dieses Problem, indem das Modell vor der Antwortgenerierung relevante Dokumente aus einer eigenen Datenbank abruft.

Wie funktioniert RAG?

Der RAG-Prozess läuft in zwei Phasen:

1. Retrieval (Abruf): Die Nutzerfrage wird in einen Vektor umgewandelt und mit einer Vektordatenbank abgeglichen, die alle relevanten Dokumente als Vektoren gespeichert hat. Die ähnlichsten Dokumente werden abgerufen.

2. Generation (Erzeugung): Das Sprachmodell bekommt die Nutzerfrage plus die abgerufenen Dokumente als Kontext und formuliert darauf basierend eine Antwort.

Die Antwort ist damit nicht nur sprachlich korrekt, sondern inhaltlich auf die tatsächlichen Unternehmensdaten gestützt.

Einsatzfelder in Unternehmen

  • Internes Wissensmanagement: Mitarbeiter stellen Fragen an ein KI-System, das auf Basis von Handbüchern, SOPs, Protokollen und internen Dokumenten antwortet.
  • Kundensupport: Ein RAG-System beantwortet Produktfragen auf Basis der aktuellen Dokumentation – immer aktuell, weil die Datenbank jederzeit aktualisiert werden kann.
  • Vertragsanalyse: Juristische oder kaufmännische Teams fragen ein RAG-System nach spezifischen Klauseln oder Konditionen in umfangreichen Vertragswerken.

Voraussetzungen für RAG

RAG braucht eine gepflegte Dokumentenbasis. Schlechte oder veraltete Dokumente führen zu schlechten Antworten. Außerdem müssen die Dokumente in die Vektordatenbank eingespielt und regelmäßig aktualisiert werden. Der Aufwand für Aufbau und Pflege ist einmalig hoch, zahlt sich aber schnell aus wenn Mitarbeiter täglich relevante Informationen suchen.

Fazit

RAG ist die sicherste und wirtschaftlichste Architektur für KI-Systeme, die auf unternehmenseigenen Daten basieren sollen. Es eliminiert Halluzinationen, bleibt stets aktuell und gibt nachvollziehbare Quellenangaben – drei Eigenschaften, die in der Unternehmenspraxis nicht verhandelbar sind.

Zurück zum Experten-Center