Self-Improving Loops KI: was heute wirklich trägt
Andrew Ng erklärt selbstverbessernde Agenten-Loops zum nächsten Schritt nach dem Prompting. Wir prüfen, was davon im Arbeitsalltag schon funktioniert.

Self-Improving Loops KI-Agenten sind laut Andrew Ng der nächste Schritt über klassisches Prompting hinaus, aber sie sind kein magischer Autonomie-Sprung. Nach der derzeit verfügbaren Quellenlage handelt es sich um eine Engineering-Praxis, in der Agenten Aufgaben iterativ bearbeiten, sich anhand von Tests selbst korrigieren und weiterhin von Menschen gesteuert werden. Was heute wirtschaftlich trägt, ist die Automatisierung klar definierter, wiederkehrender Aufgaben.
Die These wird derzeit stark verkürzt zitiert. Kursiert ein Satz, wonach in drei bis sechs Monaten alle selbstverbessernde Loops nutzen und niemand mehr prompten werde. In den geprüften Quellen findet sich dieses wörtliche Zitat nicht. Belegt sind ausführlichere und deutlich vorsichtigere Aussagen. Genau diese Lücke zwischen zugespitzter Schlagzeile und realer Aussage lohnt eine nüchterne Prüfung.
Was meint Andrew Ng mit selbstverbessernden Loops?
Ng beschreibt damit iterative Agenten-Workflows statt einmaliger Prompt-Antwort-Nutzung. Ein Agent erstellt eine Gliederung, recherchiert, schreibt einen Entwurf, bewertet sich selbst und überarbeitet. Dieser Loop ist bewusst langsamer, soll aber höhere Qualität liefern. Der Wettbewerb verschiebt sich weg vom geschickten Formulieren hin zum Aufteilen, Prüfen und Iterieren von Aufgaben.
In einer aktuellen Zusammenfassung seiner Rede wird Ng mit dem Satz wiedergegeben, der wichtigste Trend sei der Aufstieg von Agenten, während lineares Prompting nur ein erster Schritt sei (36Kr Europe). Zugleich nennt er KI insgesamt überhyped und verortet den echten Trend auf der Anwendungsebene, also in Systemen, die konkrete Aufgaben erledigen statt bloß Antworten zu geben.
Wichtig ist die Differenzierung. Ng trennt seine Agenten-These klar vom AGI-Diskurs. Echte AGI hält er für dekadenweit entfernt und den aktuellen AGI-Hype für marketinggetrieben. Er warnt sogar vor einem möglichen "AI Winter", falls überzogene Erwartungen nicht durch praktische Anwendungen ersetzt werden (Interview zu agentic AI).
Wie sieht ein selbstverbessernder Loop technisch aus?
In der Praxis besteht er aus verschachtelten Schleifen. Ein Fachbeitrag über Ngs Verständnis von Loop Engineering beschreibt drei Ebenen: eine innere, in der der Agent selbst arbeitet, eine mittlere für die Produktsteuerung und eine äußere für Markt und Nutzer. Der Agent wird so vom Frage-Antwort-Werkzeug zu einem kleinen System, das sich kontinuierlich selbst korrigiert.
- Innere Schleife: Der Agent schreibt Code auf Basis einer Spezifikation und eines Bewertungsmaßstabs, führt Tests aus, erkennt Fehler, verbessert und testet erneut, autonom und selbstkorrigierend.
- Mittlere Schleife: Entwickler justieren die Produktausrichtung. Hier steigt der Mensch nicht aus, weil das Urteil über Vision und Marktpassung nicht ersetzbar ist.
- Äußere Schleife: Nutzer und Marktbedingungen korrigieren laufend die Einschätzungen der Entwickler.
Die zentrale Konsequenz laut dem Beitrag: KI eliminiert die Loops nicht, sie komprimiert den innersten Loop auf Minuten und verschiebt damit den Schwerpunkt der Arbeit (AI TNT). Das stützt die Lesart, dass selbstverbessernde Loops eng an Tests, Evals und menschliche Steuerung gebunden bleiben.
Mein Eindruck als Berater: Genau diese Verzahnung wird in den Schlagzeilen unterschlagen. "No more prompting" klingt nach Abschaffung menschlicher Arbeit. Gemeint ist eher, dass das mühsame schrittweise Anweisen entfällt, während Aufgabenzuschnitt, Bewertung und Verantwortung wichtiger werden.
Was funktioniert davon heute schon im Arbeitsalltag?
Vor allem die Automatisierung repetitiver, strukturierter Aufgaben. Ein aktueller Rückblick auf neun Monate Agenten-Entwicklung kommt zu dem Befund, dass der überwiegende wirtschaftliche Wert bisher genau daraus stammt. Nicht vollautonome Allzweck-Agenten prägen die Praxis, sondern Workflows mit passender Autonomie für konkrete Probleme.
Diese Bandbreite reicht von einfachen linearen Abläufen bis zu mehrstufigen Argumentationsketten (Rückblick auf die Agenten-Praxis). Für die nächsten Jahre erwartet Ng viel Arbeit an Agenten für Kundenservice, medizinische Assistenz und juristische Compliance, indem Unternehmen die mentalen Schritte von Menschen als Workflows codieren.
Wer solche Workflows aufbauen will, muss die Verantwortungsfrage früh klären. Wenn ein Agent eigenständig handelt, stellt sich die Haftungsfrage anders als bei einem reinen Assistenzwerkzeug. Diese Punkte haben wir im Beitrag zu der Frage vertieft, wann der KI-"Kollege" haftet. Wer das ignoriert, baut technische Autonomie ohne organisatorische Klärung.
Für Teams, die den Sprung vom manuellen Prompting zu abgegrenzten, selbstkorrigierenden Abläufen konkret üben wollen, ist ein zweitägiger Praxisworkshop zum Aufbau eigener KI-Agenten und Automatisierungsprozesse eine sinnvolle Option, sofern Sie bereits einen konkreten, wiederkehrenden Prozess vor Augen haben. Wer nur allgemein "etwas mit Agenten" machen möchte, sollte zuerst den Anwendungsfall schärfen, sonst bleibt auch das beste Training folgenlos.
Welche Zutaten braucht ein funktionierender Loop?
Ng nennt in einem deutschsprachigen Praxis-Talk mehrere konkrete Bausteine. Der Kern ist das Zerlegen komplexer Aufgaben in kleine, schrittweise ausführbare Microtasks. Dazu kommen leichtgewichtige, aber systematische Bewertungsmechanismen, um die Loops überhaupt steuern zu können. Ohne diese Evaluation dreht ein Agent im Kreis, ohne besser zu werden.
- Workflow-Zerlegung: Komplexe Aufgaben in sinnvolle Microtasks herunterbrechen.
- Evaluation: Ng rät zu einer einfachen Bewertung, die man in rund 20 Minuten aufsetzt und dann Schritt für Schritt verbessert.
- Werkzeuge und Standards: Voice-Interfaces und Standards wie das Model Context Protocol (MCP), um Agenten robust in reale Workflows einzubetten.
- Programmierkompetenz: Ng betont, dass technische Substanz im KI-Zeitalter wichtiger wird, nicht überflüssig.
Diese Empfehlungen stammen aus einer kompakten Ableitung seiner Aussagen (KI-Agenten entwickeln: Ngs Praxiseinblicke). Wer beim Prompting selbst noch Nachholbedarf hat, findet in unserem Beitrag zu besseren Prompts für ChatGPT und Claude eine solide Grundlage, denn auch der beste Loop startet mit klar formulierten Aufgaben.
Ist Ngs Zeithorizont realistisch?
Nur teilweise. Technisch möglich sind heute innere Entwicklungs-Loops, in denen Agenten Code oder Texte iterativ erzeugen, testen und verbessern. Offen bleibt, wie breit Unternehmen in den nächsten Monaten tatsächlich zu weitgehend autonomen, selbstverbessernden Systemen übergehen. Die Quellen betonen Chancen, belegen aber keine flächendeckende Einführung.
Die Prognose "drei bis sechs Monate, kein Prompting mehr" sollten Sie deshalb als zugespitzte Erwartung lesen, nicht als belastbaren Fahrplan. Sie ist in den geprüften Quellen ohnehin nicht wörtlich nachweisbar. Belegt ist die vorsichtigere Botschaft: Agenten sind ein realer Trend, aber der Wert entsteht in praktischen Workflows mit klarer Verantwortlichkeit, nicht im Autonomie-Versprechen.
Zurück zur Ausgangsfrage, was hinter Ngs These steckt. Die Richtung stimmt: Weg vom manuellen Schritt-für-Schritt-Anweisen, hin zu Systemen, die eine Aufgabe eigenständig bearbeiten und sich anhand von Tests korrigieren. Die entscheidende Arbeit der nächsten Monate liegt aber nicht darin, dass die Technik mehr kann, sondern darin, wie sauber Sie Aufgaben zuschneiden, Evals aufsetzen und Verantwortung regeln. Daran misst sich der Nutzen, nicht an der Frist von sechs Monaten.
Häufige Fragen
Ersetzen selbstverbessernde Loops jetzt das Prompting komplett?
Nein. Das kursierende Zitat, in drei bis sechs Monaten prompte niemand mehr, lässt sich in den geprüften Quellen nicht belegen. Ng beschreibt lineares Prompting als ersten Schritt, nicht als überflüssig. Loops ergänzen gute Prompts, ersetzen sie aber nicht. Wer präzise formulieren kann, hat weiterhin Vorteile beim Aufteilen und Prüfen von Aufgaben.
Für welche Aufgaben lohnt sich der Aufwand heute wirtschaftlich?
Laut Quellenlage trägt vor allem die Automatisierung klar definierter, wiederkehrender Aufgaben. Loops sind bewusst langsamer und rechnen sich dort, wo Qualität und Wiederholung zählen, etwa bei strukturierter Recherche, Entwürfen oder Prüfschritten. Für einmalige, kreative oder unscharfe Aufgaben ist der zusätzliche Iterations-Overhead oft nicht gerechtfertigt.
Wie starte ich konkret mit agentischen Workflows?
Beginnen Sie mit einer eng abgegrenzten, wiederkehrenden Aufgabe und zerlegen Sie sie in Teilschritte: recherchieren, entwerfen, selbst bewerten, überarbeiten. Definieren Sie Tests oder Kriterien, an denen sich der Agent selbst korrigieren kann, und behalten Sie die menschliche Steuerung. Skalieren Sie erst, wenn ein Loop nachweisbar bessere Ergebnisse liefert als einfaches Prompting.
Bedeuten selbstverbessernde Loops einen Schritt Richtung AGI?
Nein. Ng trennt seine Agenten-These klar vom AGI-Diskurs. Loops sind eine Engineering-Praxis, in der Agenten Aufgaben iterativ bearbeiten und sich anhand von Tests korrigieren, weiterhin von Menschen gesteuert. Es geht um die Anwendungsebene, also Systeme, die konkrete Aufgaben erledigen, nicht um autonome Superintelligenz. Ng nennt KI insgesamt sogar überhyped.
Wer haftet, wenn ein Agent im Loop Fehler produziert?
Da Loops weiterhin von Menschen gesteuert werden, bleibt die Verantwortung beim einsetzenden Unternehmen. Wichtig sind Prüfschritte, klare Freigaben und Tests, an denen sich der Agent korrigiert. Gerade bei automatisierten, wiederkehrenden Aufgaben sollten Kontrollpunkte und Zuständigkeiten früh definiert werden, um Haftungs- und Compliance-Risiken zu begrenzen.
Was ändert sich für meine Rolle, wenn Loops üblich werden?
Der Wettbewerb verschiebt sich vom geschickten Formulieren hin zum Aufteilen, Prüfen und Iterieren von Aufgaben. Gefragt sind Fähigkeiten, Probleme in Teilschritte zu zerlegen, Qualitätskriterien zu definieren und Agenten-Ergebnisse zu bewerten. Prompting bleibt nützlich, wird aber Teil eines größeren Workflow-Handwerks statt der zentralen Kompetenz.
Diskussion
Noch keine Kommentare. Schreiben Sie den ersten.
Weiterlesen
Mehr aus KI Agenten →
KI-Agenten im Unternehmen: Wenn der "Kollege" haftet
Immer mehr Firmen geben ihren KI-Agenten Namen wie "Alex" und behandeln sie als Kollegen. Das mag intern die Akzeptanz erhöhen, schafft aber ein Governance-Problem: Wer haftet, wenn der digitale Kollege einen Fehler macht?

Microsoft Copilot AutoPilot Agenten: was Firmen wissen müssen
Microsoft plant, seine Copilot-Apps zu vereinheitlichen und Agenten namens AutoPilot im Hintergrund arbeiten zu lassen. Wir trennen die berichteten Fakten von unbestätigten Behauptungen und ordnen ein, was der Aufpreis wert sein könnte.

KI-Agenten Software: Wie Entwickler ihre Apps umbauen
KI-Agenten lösen selbstständig Aktionen aus, rufen Daten ab und starten Zahlungen. Softwareanbieter reagieren mit neuen Tarifen, granularen Rechten und maschinenlesbaren Schnittstellen. Was daran wirklich neu ist und was Sie jetzt prüfen sollten.

KI-Agenten Freelance: Was der Remote Labor Index zeigt
Der Remote Labor Index testet 240 reale Freelance-Projekte. Die beste Automation Rate liegt bei 2,5 Prozent. Wir ordnen ein, welche Aufgaben KI-Agenten heute zuverlässig übernehmen und wo Ihr Team weiterhin gebraucht wird.

Gemini Spark: Googles Mac-Assistent im Realitätscheck
Gemini Spark soll als persönlicher KI-Agent rund um die Uhr Aufgaben auf dem Mac erledigen. Ein Blick auf den verifizierten Stand zeigt: Die Mac-App ist da, der eigentliche Agent aber noch US-Beta.

KI-Agenten Business-Software: 234 Milliarden im Umbruch
Gartner beziffert den Softwareumsatz, der durch KI-Agenten unter Druck gerät, auf bis zu 234 Milliarden US-Dollar. Wir ordnen ein, was hinter der Zahl steckt und welche Schritte für Unternehmen jetzt sinnvoll sind.