← Zurück zum Glossar

RAG (Retrieval-Augmented Generation)

Definition

Architekturmuster, bei dem ein Sprachmodell zur Beantwortung einer Anfrage zunächst relevante Dokumente aus einer Wissensbasis abruft — typischerweise über semantische Suche in einer Vektordatenbank — und diese als Kontext in den Prompt integriert.

Noise — Signal

RAG wird häufig als Lösung für drei separate Probleme verkauft: Aktualität, Halluzination und Compliance. Es löst zuverlässig nur das erste. Halluzinationen werden reduziert, nicht eliminiert — das Modell kann abgerufene Quellen falsch interpretieren, widersprüchliche Quellen mischen oder den Kontext schlicht ignorieren. Und Compliance ist eine Eigenschaft des Gesamtsystems aus Quellrechten, Audit-Trails, Begründungsketten und Zugriffskontrolle, nicht der Architektur. Eine RAG-Pipeline allein erfüllt keine regulatorische Anforderung.

Die richtige Frage

Nicht: "Sollen wir RAG einführen, um Halluzinationen zu vermeiden?" Sondern: "Wie messen wir die Qualität der abgerufenen Quellen, wie dokumentieren wir die Begründungskette einer Antwort, und wer trägt die Verantwortung, wenn das Modell den richtigen Kontext bekommt und ihn trotzdem falsch verwendet?"

← Zurück zum Glossar