Die inflationäre Verwendung des Begriffs "KI-Agent" führt zu Konfusion. Der anerkannte Entwickler Simon Willison schlägt eine klare, auf technischen Prinzipien basierende Definition vor, um die Diskussion zu versachlichen: Ein LLM-Agent führt Werkzeuge in einer Schleife aus, um ein Ziel zu erreichen.

 

KI-Agenten: Simon Willison fordert eine präzise technische Definition

Die uneinheitliche Definition von KI-Agenten erschwert den fachlichen Diskurs und die Entwicklung robuster Systeme. Simon Willison adressiert dieses Problem mit einem Vorschlag für eine klare und technisch fundierte Definition, die sich auf die Kernmechanik solcher Systeme konzentriert.

Kernaussagen

  • Klare Definition: Ein Agent ist ein System, bei dem ein Large Language Model (LLM) Tools in einer Schleife (Loop) ausführt, um ein definiertes Ziel zu erreichen.
  • Kernkomponente "Tools": Die Fähigkeit, externe Funktionen oder APIs aufzurufen, ist ein konstitutives Merkmal eines Agenten.
  • Kernkomponente "Loop": Der iterative Prozess, bei dem das LLM Aktionen anfordert und deren Ergebnisse zur weiteren Planung nutzt, ist zentral.
  • Kernkomponente "Ziel": Ein Endzustand oder eine Abbruchbedingung muss existieren, um den agentischen Prozess zu beenden.
  • Abgrenzung: Willisons Definition grenzt sich bewusst von der Marketing-Vorstellung ab, Agenten seien ein direkter Ersatz für menschliche Arbeitskräfte.

Die Notwendigkeit einer einheitlichen Terminologie

In der aktuellen KI-Landschaft wird der Begriff "Agent" für eine Vielzahl von Systemen verwendet, von einfachen Chatbots mit API-Anbindung bis hin zu komplexen, autonomen Systemen. Diese begriffliche Unschärfe behindert eine präzise Kommunikation unter Entwicklern und Forschern. Eine gemeinsame, technische Definition ist die Voraussetzung, um Architekturen, Leistungsfähigkeit und Grenzen verschiedener agentischer Systeme sinnvoll vergleichen zu können.

Willisons Definition im Detail

Willison destilliert das Konzept auf seine grundlegenden technischen Komponenten. Sein Vorschlag lautet:

Ein LLM-Agent führt Werkzeuge in einer Schleife aus, um ein Ziel zu erreichen.

Diese Definition ist bewusst minimalistisch, aber präzise.

  • "Werkzeuge in einer Schleife ausführen" beschreibt den fundamentalen operativen Zyklus. Das LLM agiert nicht nur als passiver Textgenerator, sondern als Reasoning-Engine, die aktiv entscheidet, welche Aktion als Nächstes ausgeführt werden muss. Es fordert die Ausführung eines Werkzeugs (z.B. ein API-Call, eine Datenbankabfrage) an und erhält das Ergebnis als neuen Input für den nächsten Denkprozess. Dieser Zyklus wiederholt sich, bis das Ziel erreicht ist.
  • "um ein Ziel zu erreichen" impliziert eine gerichtete Autonomie. Der Agent operiert nicht ziellos, sondern arbeitet auf eine vordefinierte Erfolgs- oder Abbruchbedingung hin. Dies ist der entscheidende Unterschied zu einem reinen Chat-Modell, das lediglich auf eine Benutzereingabe reagiert.

Abgrenzung von Science-Fiction und Marketing-Narrativen

Willison positioniert seine Definition klar gegen die in der Geschäftswelt verbreitete Vorstellung, bei der Agenten primär als autonomer Ersatz für menschliche Angestellte dargestellt werden. Er kritisiert diese Sichtweise als irreführend und technisch verfrüht. Aktuellen KI-Systemen fehlt es an grundlegenden Eigenschaften wie Verantwortlichkeit (Accountability), die für einen solchen Einsatz unabdingbar wären.

Er kritisiert zudem die inkonsistente Verwendung des Begriffs durch Unternehmen wie OpenAI. Eine klare Terminologie ist für die technische Community wichtiger als eine breite, aber vage Marketing-Ansprache. Willisons Vorschlag bietet eine solide Grundlage für Entwickler, um über die Architektur und Implementierung von LLM-basierten, autonomen Systemen zu diskutieren.