Harness-Engineering: Die Systemarchitektur, die KI-Agenten produktiv macht

Warum nicht das KI-Modell selbst, sondern die Systemarchitektur rund um Kontext, Regeln und Feedbackschleifen über den Erfolg autonomer KI-Agenten entscheidet.

By Nicole Lontzek Last updated 22. Mai 2026

Harness-Engineering definiert Regeln, Kontext und Feedback für KI-Agenten – und wird damit zur Schlüsseltechnologie moderner KI-Systeme.

Der Begriff “Harness” stammt ursprünglich aus dem Reitsport. Damit gemeint ist das Geschirr, das dem Pferd angelegt wird, um es richtig führen zu können. In der Engineering-Welt ist ein Harness demnach die Infrastruktur für KI-Agenten, die den Modellen durch Einschränkungen, Richtlinien und Feedback Zyklen einen Rahmen geben. Das Modell selbst ist vergleichbar mit einem Pferd. Leistungsstark, aber es benötigt Lenkung. Der Ingenieur ist in dieser Metapher der Reiter, der die Richtung vorgibt, aber nicht selbst rennt. Harness-Engineering ist das Design und die Implementierung von Systemen, die architektonische Grenzen setzen und Abhängigkeitsregeln definieren. Die KI-Agenten werden darüber informiert, was ihre Aufgaben sind. Das Harness liefert die notwendige Dokumentation und den Kontext, es verifiziert, ob eine Aufgabe korrekt ausgeführt wurde und korrigiert die Agenten mittels Feedbackschleifen. KI-Modelle und Agenten fluten derzeit den Markt und die Community. Der entscheidende Unterschied liegt in der Systemarchitektur drum herum, denn bereits kleine Änderungen in jener, können große Auswirkungen auf die Ergebnisse erzielen und das ganz ohne am Modell selbst etwas ändern zu müssen.

Index

Auf den Rahmen kommt es an

Open AI hat sich dieser Thematik im August 2025 in einem Selbstexperiment gewidmet und Anfang des Jahres dazu einen lesenswerten Artikel dazu veröffentlicht.

Fünf Monate lang arbeitete ein Team an einer internen Beta-Version einer Software, entwickelte sie und stellte sie bereit und hat dabei nicht eine Zeile Code selbst geschrieben. Der gesamte Code, die Anwendungslogik, die Tests, Dokumentation und Überwachung wurde alles von einem internen Tool geschrieben. Die Entwickler schätzen, dass sie lediglich ein Zehntel der Zeit benötigten, als wenn sie die Software manuell geschrieben hätten. Am Ende entstanden auf diese Weise über eine Millionen Zeilen Code. Die zentrale Frage, die sich das Team rund um Open AI gestellt hat, war nicht mehr: “Wie schreibe ich in kurzer Zeit funktionierenden Code?” Sondern: “Welche Umgebung wird benötigt, um dieses Ziel mit KI-Agenten zu erreichen?” So war der Auftrag das Entwerfen einer geeigneten Umgebung, das Spezifizieren von Intention, sowie klar ausdefinierte Feedbackschleifen. Was mit einem leerten Git-Repository gestartet ist, enthält nun eine Millionen Codezeilen, die verteilt sind auf Infrastruktur, Anwendungslogik, Dokumentation, Entwicklertools und Tooling selbst.

Dieses Beispiel zeigt eindrucksvoll, weshalb Harness Engineering so mächtig ist. Dabei zeigt sich auch ein grundlegender Wandel im Umgang mit KI-Systemen. Während reines Prompt-Engineering darauf abzielt, einzelne Interaktionen mit einem Modell zu optimieren, beschäftigt sich Harness-Engineering mit der Orchestrierung vollständiger Systeme.

Die zentrale Herausforderung besteht nicht mehr nur darin, möglichst gute, präzise Prompts zu formulieren, sondern eine Umgebung zu schaffen, in der KI-Agenten kontrolliert, reproduzierbar und effizient arbeiten können. Kontextbereitstellung, Feedbackschleifen, Regeln und Observability werden damit wichtiger als das Modell allein.

Um Harness-Engineering in der Breite anwendbar zu machen, stellt Open AI zudem ein Framework bereit, das sich in drei Kategorien einteilt: Context-Engineering, architektonische Einschränkungen und Entropie-Management.

Ein Harness selbst besteht in der Praxis aus mehreren technischen Komponenten, die gemeinsam die Arbeitsumgebung der KI-Agenten definieren. Dazu zählen unter anderem:

Systeme zur Bereitstellung von Kontext und Dokumentation
Toolings für Retrieval, Speicher und Wissenszugriff
Observability-Lösungen für Logs, Metriken und Traces
Evaluierungs- und Test-Pipelines
Richtlinien- und Permission-Systeme
Mechanismen zur Aufgabenverteilung und Agenten-Orchestrierung
Feedback- und Review-Systeme

Erst das Zusammenspiel dieser Komponenten ermöglicht es, KI-Agenten kontrolliert in produktiven Softwaresystemen einzusetzen und ihr volles Potenzial auszuschöpfen. Dieses Grundgerüst ermöglicht den Einsatz des vorher erwähnten Frameworks.

Context-Engineering

Context-Engineering ist der Hebel um sicherzustellen, dass die KI-Agenten über die richtigen Informationen zur richtigen Zeit verfügen können. Hierbei wird unterschieden in “statischem Kontext” und “dynamischen Kontext”. Statisch kann zum Beispiel die Repository-lokale Dokumentation sein. Also API-Verträge oder Styleguides. Dynamisch hingegen ist das Mapping der Verzeichnisstruktur beim Start der Agenten, sowie Observability Daten wie Logs, Metriken und Traces.

Architektonische Einschränkungen

Durch die hier gesetzten Rahmenbedingungen, wie zum Beispiel benutzerdefinierte Regeln, Agenten, die wiederum andere Agenten überwachen, automatisierte Prüfungen bevor Code festgeschrieben wird oder Strukturtests wird im Grunde erzwungen, wie Code aussehen soll. Diese Einschränkungen helfen den Agenten zielgerichteter zu einer Lösungen zu kommen und weniger Token zu verbrauchen.

Entropie-Management

Mit der Zeit entsteht bei KI-generierten Codebasen unweigerlich Datenmüll. Um dieser Tatsache Rechnung zu tragen, kommmen auch hier Agenten zum Einsatz. Die einen prüfen auf Konsistenz in der Dokumentation, andere erzwingen die Nutzung vorgegebener Muster. Wiederum andere scannen Code, der bei vorherigen Prüfungen nicht geflaggt wurde und nicht den Vorgaben entspricht. Diese Agenten arbeiten periodisch und erledigen den internen “Hausputz”.

Mit der zunehmenden Verbreitung autonomer KI-Agenten verändert sich auch die Rolle der Softwareentwicklung grundlegend. Der Fokus verschiebt sich schrittweise vom manuellen Schreiben einzelner Implementierungen hin zur Orchestrierung intelligenter Systeme. Entwickler definieren dabei immer seltener jede konkrete Lösung selbst, sondern entwerfen die Rahmenbedingungen, innerhalb derer KI-Agenten arbeiten können.

Die Aufgabe des Engineers besteht künftig stärker darin, Ziele, Regeln und Constraints zu formulieren. Architekturprinzipien, Sicherheitsrichtlinien, Qualitätsanforderungen und Feedbackmechanismen werden zu zentralen Bestandteilen der Entwicklungsarbeit. Das eigentliche Schreiben von Code entwickelt sich zunehmend zu einem automatisierten Ausführungsprozess innerhalb eines kontrollierten Systems.

Harness-Engineering wird damit zu einer Kernkompetenz moderner Softwareentwicklung. Nicht das einzelne Modell entscheidet über die Qualität eines Systems, sondern die Fähigkeit, Kontext bereitzustellen, Agenten zu koordinieren und deren Ergebnisse kontinuierlich zu evaluieren.

Je leistungsfähiger KI-Modelle werden und je stärker sie sich technologisch angleichen, desto wichtiger wird die Systemarchitektur rund um diese Modelle. Das Harness entwickelt sich damit vom unterstützenden Werkzeug zum eigentlichen Produktionssystem für KI-Agenten. Wenn KI-Modelle also zunehmend zur austauschbaren Commodity werden, entscheidet letztlich das Harness über die Qualität, Sicherheit und Skalierbarkeit autonomer Systeme und Harness-Engineering kann als nächste Evolutionsstufe einen wertvollen Beitrag leisten.

Nicole Lontzek

Nicole Lontzek ist Marketing - und Digitalexpertin. Ihre Karriere brachte sie unter anderem nach New York, Dublin und Zürich. Sie ist spezialisiert auf die Vermarktung von B2B-Software Unternehmen mit komplexen, erklärungsbedürftigen Produkten und Lösungen. Derzeit ist sie in München als Chief Marketing Officer bei QAware für die Gesamtvermarktungstrategie verantwortlich. In ihrem Buch "Digitale Zeitmacher - was wir jetzt gewinnen" erläutert sie anhand positiver Beispiele die Möglichkeiten der Digitalisierung und zeigt auf, in welchen Bereichen wertvolle Lebenszeit eingespart werden kann. www.digitalezeitmacher.de