KI-Agenten sollten ein Unternehmen leiten

Hier ist der Grund, warum es (noch) nicht geklappt hat.

By Britta Daffner On 26. Juni 2025

KI-Agenten werden als die Zukunft der Arbeit angepriesen, und CEOs sagen voraus, dass sie einen großen Teil der Belegschaft in Unternehmen ersetzen werden. Eine aktuelle Studie der Carnegie Mellon University zeigt aber, dass die Realität noch nicht so weit ist: Als KI-Agenten die Aufgabe bekamen, ein virtuelles Unternehmen zu leiten, schafften selbst die besten Modelle weniger als ein Viertel ihrer Aufgaben. Von mangelndem sozialen Verständnis bis hin zu fehlender Flexibilität und Selbstbewusstsein – die aktuelle Generation von Agenten hat mit der Komplexität der realen Welt zu kämpfen. Während erste Anwendungsfälle – wie KI in der Softwareentwicklung oder CEOs, die Avatare in Gewinnbekanntgaben einsetzen – vielversprechend sind, ist eine vollständige Automatisierung noch in weiter Ferne. Die echte Chance? Menschliche Teams zu ergänzen, nicht zu ersetzen.

KI-Agenten sind gerade total angesagt. Amazon-Chef Andy Jassy sagt voraus, dass generative KI bald einen großen Teil der Arbeitskräfte in Unternehmen ersetzen wird. Andere Führungskräfte denken auch, dass KI-Agenten den Arbeitsmarkt stark verändern werden – mit der Möglichkeit, dass Jobs verloren gehen, aber auch neue entstehen.

Aber wie sieht es wirklich aus?

Ein Blick auf den aktuellen Gartner Hype Cycle zeigt: KI-Agenten sind gerade auf dem Höhepunkt der übertriebenen Erwartungen. Der Weg zu echter Produktivität ist noch lang.

Gartner Hype Cycle for AI Technologies — Gartner Hype Cycle für KI-Technologien – Grafik von Britta Daffner via Gartner

Index

Das große Experiment: Ein komplett von KI geführtes Unternehmen

Forscher der Carnegie Mellon University haben den ultimativen Praxistest gemacht: ein komplett virtuelles Softwareunternehmen, das nur mit KI-Agenten von OpenAI, Google, Anthropic und Meta besetzt war. Es waren keine Menschen dabei – außer zum Beobachten und Bewerten.

In dieser Simulation namens „TheAgentCompany” übernahmen die Agenten Rollen wie Softwareentwickler, Projektmanager und Finanzanalysten. Zu ihren Aufgaben gehörten:

Leistungsbeurteilungen schreiben
Neue Büroräume bewerten
Datenanalysen durchführen
Chat-Tools zur Koordination nutzen

Das Ergebnis? Ernüchternd.

Der „beste” Agent (Claude 3.5 von Anthropic) schaffte nur 24 % der Aufgaben.
Google Gemini erzielte eine Erfolgsquote von etwa 11 %.
Der Agent von Amazon schaffte weniger als 2 %.

Viele Aufgaben scheiterten an scheinbar trivialen Problemen: Ein Popup-Fenster ließ sich nicht schließen; anstatt den richtigen Kollegen zu fragen, erstellte ein Agent einfach einen falschen Benutzer mit dem gewünschten Namen.

Die Forscher spekulierten über die Ergebnisse und stellten fest, dass die Agenten einen auffälligen Mangel an gesundem Menschenverstand, schwache soziale Kompetenzen und die Unfähigkeit aufweisen, sich in digitalen Umgebungen effektiv zurechtzufinden. In einigen Fällen gingen die Agenten sogar so weit, sich selbst zu täuschen – sie erstellten Abkürzungen oder falsche Lösungen, die völlig am Ziel der Aufgabe vorbeigingen und letztendlich ihren eigenen Erfolg untergruben.

Warum Agenten (immer noch) scheitern

Die Carnegie-Mellon-Studie und andere Untersuchungen zeigen immer wieder die gleichen Schwächen auf:

Mangelnder gesunder Menschenverstand: Agenten verstehen oft nicht, wie Dinge in der realen Welt zusammenhängen. Ein Agent sollte zum Beispiel Büroräume bewerten und entschied sich vor allem wegen der schönen Fotos auf der Website für einen Standort – ohne die langen Pendelzeiten und Kosten zu berücksichtigen. „Weil Menschen manchmal sagen, was sie mögen – aber nicht, was sie wirklich brauchen.“
Schlechte soziale Intelligenz: Die Kommunikation im Team wird falsch verstanden oder nicht weiterverfolgt. Ein Agent wurde gebeten, einen bestimmten Teamkollegen zu konsultieren. Der Agent konnte die richtige Person für seine Fragen im Unternehmenschat nicht finden. Daraufhin entschied er sich für eine Abkürzung und benannte einen anderen Nutzer in den Namen des gewünschten Nutzers um. Anstatt ihm eine Nachricht zu senden, erstellte er also ein neues Nutzerkonto mit demselben Namen und „sprach“ mit dieser falschen Person.
Kein Selbstbewusstsein: Agenten erkennen ihre Rolle oder den Kontext nicht. Beispielsweise gaben Agenten, denen die Rolle eines Junior-Praktikanten zugewiesen wurde, Befehle wie ein Chef, als wären sie in der Geschäftsleitung, ignorierten dabei völlig ihren festgelegten Platz in der Hierarchie und waren sich nicht bewusst, dass sie nicht verantwortlich waren. Rolle? Irrelevant. Kontext? Vergessen.

Diese letzte Erkenntnis wird durch Untersuchungen der Harvard Business School bestätigt. Menschen passen sich intuitiv an neue Kontexte an – KI nicht. Die Fähigkeit zur „Selbstorientierung“ bleibt einzig und allein dem Menschen vorbehalten.

Was bedeutet das für die Praxis?

Trotz dieser Einschränkungen befinden wir uns mitten in einer Agent-Hype-Welle. CEOs sprechen öffentlich davon, dass Agenten ganze Abteilungen ersetzen werden. Eine Studie von OpenAI aus dem Jahr 2023 prognostiziert, dass Berufe wie Finanzanalysten und Verwaltungsangestellte besonders anfällig für Automatisierung sein werden.

Aber: Diese Studien basieren auf theoretischen Annahmen – nicht auf der Umsetzung in der Praxis.

Was diese neue Studie bietet, ist die Realität.

Selbst in klar definierten Rollen versagen Agenten, sobald Aufgaben komplex werden oder den Einsatz mehrerer Tools erfordern. Eine Analyse der LangChain-Community hat gezeigt: Je mehr Tools und Kontexte ein Agent verarbeiten muss, desto geringer ist die Erfolgsquote.

Wo können KI-Agenten heute wirklich helfen?

Es wäre falsch, KI-Agenten komplett abzuschreiben. In einigen Bereichen liefern sie bereits einen Mehrwert:

Softwareentwicklung: Dank umfangreicher Trainingsdaten schneiden Agenten hier oft besser ab als in anderen Bereichen.
Produktionsoptimierung: Johnson & Johnson hat mit KI-Agenten die Produktionszeiten für Chemikalien um 50 % reduziert.
Rechtliche Prüfungen: LG setzt Agenten ein, um Lizenzen schneller zu überprüfen als Teams aus menschlichen Juristen.
Ergebnisbekanntgaben: Tech-CEOs experimentieren sogar damit, sich selbst zu ersetzen – zumindest vorübergehend. Der CEO von Klarna hat einen KI-Stimmklon eingesetzt, der anhand seiner früheren Anrufe trainiert wurde, um einen Teil des Ergebnisberichts zu präsentieren. Der CEO von Zoom hat etwas Ähnliches gemacht und getestet, ob Avatare repetitive Präsentationsaufgaben übernehmen können. Das hat zwar Kritik in Sachen Transparenz ausgelöst, zeigt aber auch einen konkreten Anwendungsfall: KI-Agenten können bereits bei standardisierter Kommunikation in kontrollierten Umgebungen helfen.

Aber auch diese Anwendungsfälle basieren auf einem „Human-in-the-Loop”-Modell. Eine vollständige Automatisierung ist (noch) keine Option.

Das größte Missverständnis?

Die Vorstellung, dass KI-Agenten bald ganze Unternehmen leiten oder die Personalabteilung ersetzen werden. In Wahrheit ähneln sie derzeit eher hochmotivierten, aber überforderten Praktikanten. Wenn man ihnen zu viel Verantwortung überträgt, ist Chaos vorprogrammiert.

Fazit: Zwischen Hype und Realität unterscheiden

KI-Agenten sind ein spannendes, schnelllebiger Bereich. Sie werden unsere Arbeit in den kommenden Jahren zweifellos verändern. Aber wir sind noch weit davon entfernt, dass sie komplexe Unternehmensaufgaben zuverlässig selbstständig erledigen können.

Anstatt sich von übertriebenen Automatisierungsvisionen blenden zu lassen, sollten Unternehmen sorgfältig prüfen:

Welche Aufgaben sind gut strukturiert und wiederholen sich?
Wo können Agenten den Menschen entlasten?
Wo brauchen wir menschliche Flexibilität, Urteilsvermögen und Empathie?

Denn: Zukunftsfähige Unternehmen werden nicht durch Agenten ersetzt – sie werden von Menschen geführt, die KI kritisch und effektiv einsetzen.

Britta Daffner

As Director Data & AI at O2 Telefónica, Britta champions data-driven business transformation. She is also the founder of "dy.no," a platform dedicated to empowering change-makers in the corporate and business sectors. Before her current role, Britta established an Artificial Intelligence department at IBM, where she spearheaded the implementation of AI programs for various corporations. She is the author of "The Disruption DNA" (2021), a book that motivates individuals to take an active role in digital transformation.

Agentische KI AI Hype KI-Technologien Technologien Trends