Automatisieren & Agenten

KI-Agenten erklärt: Wann sich ein RAG-System lohnt

Veröffentlicht am 26. Mai 20268 Min. LesezeitVon Osman Öztopcu

Stapel papierener Akten in einem Aktenschrank, beschriftet mit Jahreszahlen — Sinnbild für unstrukturiertes Firmenwissen

„Wir bauen euch einen KI-Agenten mit RAG." Den Satz hört man 2026 in jedem zweiten Verkaufsgespräch. Hinter den Schlagworten stehen zwei sehr konkrete Werkzeuge — und für die meisten kleinen Betriebe ist nur eines davon der richtige erste Schritt. Dieser Artikel sortiert: Was *Agent* heißt, was *RAG* heißt, wann es sich lohnt und wann eine einfache Automatisierung der ehrlichere Anfang ist.

Drei Stufen — und du brauchst meistens nur die erste

Es hilft, KI in deinem Betrieb auf einer kleinen Treppe zu sortieren. Jede Stufe kann mehr — und kostet mehr Aufwand. Die meisten Betriebe brauchen 2026 nicht mehr als die erste.

Einfache Automatisierung

Ein klarer Ablauf: Auslöser → ein KI-Schritt liest oder formuliert Text → fertige Aktion. Beispiel: eingehende E-Mail → KI ordnet ein und entwirft Antwort → landet im Postfach.

RAG — KI mit Zugriff auf dein Wissen

Dieselbe KI, aber sie darf vor dem Antworten in deinen eigenen Dokumenten nachschlagen. „Retrieval Augmented Generation" heißt wörtlich: Antworten, ergänzt um eine Suche in deinem Wissen.

Agent — KI, die mehrere Schritte selbst plant

Ein System mit einem Ziel und mehreren Werkzeugen, das selbst entscheidet, wann es nachschlägt, antwortet, verschickt oder weiterleitet. Mächtig, aber für die meisten Routinen Overkill.

Was ist RAG — in Alltagssprache

Eine KI ohne RAG kennt nur, was sie beim Training gelesen hat — also das allgemeine Internet, einen Stand von vor Monaten, nichts über deinen Betrieb. Frag sie, wann ihr zuletzt die Preise erhöht habt, und sie rät. Eine KI mit RAG sucht vor dem Antworten erst in deinen eigenen Quellen — Preisliste, Handbuch, alte Angebote, Verträge — und gibt dir die Antwort mit Fundstelle.

Das ist der ganze Trick: Die KI weiß nicht plötzlich mehr — sie *darf nachschlagen*. Genau wie ein neuer Mitarbeiter, der nicht alles im Kopf hat, aber gelernt hat, wo es steht. Der Fachausdruck „Retrieval Augmented Generation" bedeutet wörtlich nichts anderes als: *Antworten, ergänzt um eine Suche.*

In der Praxis besteht ein RAG-System aus drei Teilen: deine Dokumente werden einmal aufbereitet (in kleine Häppchen geschnitten und indiziert), bei jeder Frage werden die passenden Häppchen gesucht, und das Sprachmodell formuliert die Antwort daraus. Wenn du in einem Artikel „Vektor-Datenbank" oder „Embeddings" liest — das sind die technischen Namen für genau diese Aufbereitung.

Wann lohnt sich RAG für einen kleinen Betrieb?

RAG verdient sich überall dort, wo dieselbe Frage immer wieder kommt und die Antwort in deinen eigenen Unterlagen steht — aber niemand Zeit hat zu suchen. Drei Konstellationen, in denen sich das in der Praxis schnell lohnt:

Internes Nachschlagewerk. Verträge, Preislisten, Handbücher, Wartungsprotokolle, alte Angebote — alles, wo Mitarbeitende heute „suchen, fragen, jemanden anrufen". Ein RAG-Assistent ersetzt die Suche, nicht die Entscheidung.
Kundenanfragen mit Wissensbezug. „Passt euer Modell XYZ zu meinem Gerät von 2019?" — wenn die Antwort in einer Produktdatenbank oder Dokumentation steht, beantwortet RAG das in Sekunden, mit Beleg.
Angebote und Texte aus eurem Stil. Aus euren bisherigen Angeboten lernt das System eure Formulierungen — der nächste Entwurf klingt nach euch, nicht nach ChatGPT.

Ein guter Indikator: Wenn du den Satz „Das müsste irgendwo in einem alten Dokument stehen" mehr als einmal pro Woche denkst, hast du einen RAG-Fall.

Wann RAG (noch) nicht der richtige Start ist

Genauso ehrlich die Gegenseite. RAG ist nur so gut wie das Wissen, das du ihm gibst. Wenn dein Wissen über den Betrieb hauptsächlich in deinem Kopf steckt und nicht in Dokumenten, baut dir RAG keinen Wissens-Assistenten — sondern verstärkt das Durcheinander. Sechs Zeichen, dass es noch zu früh ist:

Dein Expertenwissen ist nirgendwo aufgeschrieben.
Dokumente liegen verstreut über E-Mail, Drive, WhatsApp und Papierordner.
Es ist unklar, welche Version eines Dokuments gerade gilt.
Niemand ist verantwortlich, dass das Wissen aktuell bleibt.
Dieselbe Frage würden zwei Leute aus dem Team unterschiedlich beantworten.
Du hast noch nie eine einfache KI-Automatisierung laufen.

Brauche ich einen Agenten — oder reicht RAG?

Ein Agent ist die nächste Stufe nach RAG: ein System mit einem Ziel und mehreren Werkzeugen, das selbst entscheidet, was es als Nächstes tut. Zum Beispiel: „Bearbeite Kundenanfragen vollständig" — der Agent liest die Mail, entscheidet ob er nachschlagen oder antworten muss, fragt vielleicht den Kalender, entwirft die Antwort, legt eine Aufgabe an.

Klingt nach der Königslösung. Ist sie selten. Drei Gründe, warum Agenten für die meisten kleinen Betriebe 2026 noch nicht der richtige Start sind:

Sie sind unberechenbarer. Mehr Freiheit heißt mehr Möglichkeiten, etwas zu tun, was du nicht wolltest. Für Routine reicht ein vorhersehbarer Ablauf — und ist sicherer.
Sie sind teurer im Betrieb. Ein Agent ruft das Sprachmodell mehrfach pro Anfrage auf, statt einmal. Bei jeder Antwort.
Sie sind aufwendiger zu kontrollieren. Wenn ein Agent etwas Falsches gemacht hat, ist die Frage „warum" deutlich schwieriger zu beantworten als bei einem geraden Ablauf.

Die ehrliche Empfehlung: erst eine einfache Automatisierung, dann RAG, dann Agent. Wer mit dem Komplexesten anfängt, bleibt im Bauen stecken — eine Beobachtung, die für KI-Einführungen quer durch den Mittelstand stimmt. Ob dein Betrieb für Agenten überhaupt schon bereit ist, beantwortet der kostenlose KI-Agenten-Check in fünf Minuten.

Wie der Einstieg konkret aussieht

Wenn du dich entscheidest, dass es bei dir ein RAG-Fall ist — drei realistische Etappen:

Wissen einsammeln. Welche 5–20 Dokumente decken 80 % der wiederkehrenden Fragen ab? Genau die — nicht alles, was du je geschrieben hast. Ein klar definierter kleiner Korpus schlägt einen riesigen unordentlichen.
Klein aufsetzen, mit Freigabe. Das System läuft zuerst intern, ein Mensch sieht die Antworten mit Quellenangabe, bevor sie rausgehen. So findest du die Lücken — und das Team gewinnt Vertrauen.
Erweitern, was sich bewährt. Häufige Fragen ohne gute Antwort werden zur To-Do-Liste: das Dokument fehlt, ist veraltet oder widersprüchlich. Das ist nicht ein Mangel von RAG — das ist sein wertvollster Nebeneffekt.

Die Investition ist überschaubar: Ein klar umrissenes RAG-System für einen kleinen Betrieb läuft im laufenden Betrieb meist im Bereich weniger zig Euro pro Monat — der Aufwand steckt im Aufsetzen und im Wissen ordnen, nicht im Strom-Verbrauch. Wer wissen will, was die reine Nutzung an Modell-Kosten verursacht, kann das mit dem KI-Kosten-Rechner vorab durchspielen. Und ob Datenlage und Umfang bei dir für RAG reichen, klärt eine KI-Beratung für kleine und mittlere Betriebe, bevor der erste Euro fließt.

Wann ein Agent wirklich der nächste Schritt ist

Es gibt einen Punkt, an dem es sich umkehrt: Wenn dein RAG-Assistent stabil läuft, dieselben Folge-Aktionen aber jedes Mal manuell sind — Mail rausschicken, Termin anlegen, Aufgabe vergeben — wird der nächste Schritt logisch. Genau das macht ein Agent: aus der einen Antwort *die mehreren Aktionen*, die danach kommen.

Konkretes Beispiel: Eine Reklamation kommt rein. Der RAG-Assistent klärt, ob die Garantie noch gilt (Antwort aus den Bedingungen). Der Agent geht weiter: er entwirft die Antwort, legt einen Rückruf in den Kalender, informiert das Lager. Das ist der Übergang. Ohne den darunter liegenden RAG-Teil ist der Agent blind — deswegen die Reihenfolge.

Du hast einen konkreten Wissens-Engpass im Kopf — und überlegst, ob es bei dir RAG, ein Agent oder einfach eine schlanke Automatisierung sein sollte? Der kostenlose KI-Potenzialcheck sortiert es in drei Minuten.

KI-Potenzialcheck starten

Häufige Fragen

Was ist der Unterschied zwischen ChatGPT und einem RAG-System?+

ChatGPT kennt nur das allgemeine Wissen, mit dem es trainiert wurde — nichts über deinen Betrieb. Ein RAG-System ist dasselbe Sprachmodell, das vor dem Antworten in deinen eigenen Dokumenten nachschlägt und die Antwort mit Quelle aus deinen Unterlagen formuliert. Praktisch: ChatGPT antwortet allgemein und manchmal falsch, RAG antwortet mit Beleg aus deinem Wissen.

Bleiben meine Daten dabei sicher?+

Das ist eine Frage der Architektur. Ein RAG-System kann so gebaut werden, dass deine Dokumente in der EU bleiben — entweder bei einem europäischen Anbieter oder sogar auf einem Server, den ihr selbst kontrolliert. Daten landen nicht zwangsläufig „bei OpenAI". Das gehört von Anfang an mitgedacht, ist aber lösbar.

Was kostet ein RAG-System pro Monat?+

Für einen kleinen Betrieb mit einem klar umrissenen Wissens-Korpus liegen die laufenden Modell- und Hosting-Kosten meist im niedrigen bis mittleren zweistelligen Euro-Bereich pro Monat. Der eigentliche Aufwand steckt im einmaligen Aufsetzen und in der Pflege des Wissens — also in der Vorbereitung, nicht im Strom.

Müssen meine Dokumente eine bestimmte Form haben?+

Nein, RAG verdaut PDFs, Word-Dateien, Webseiten, Tabellen. Aber: Je klarer die Dokumente sind, desto besser die Antworten. Eine saubere Preisliste schlägt zehn widersprüchliche Versionen davon. Wenn deine Dokumente sich gegenseitig widersprechen, wird das System dir das schonungslos zeigen — was nervig, aber wertvoll ist.

Brauche ich gleich einen Agenten oder reicht RAG?+

Für den Einstieg fast immer RAG. Ein Agent ist sinnvoll, wenn auf jede Antwort mehrere unterschiedliche Folge-Aktionen kommen — und der RAG-Teil bereits stabil läuft. Ohne das Wissens-Fundament ist ein Agent blind. Reihenfolge: einfache Automatisierung → RAG → Agent.