Agent Harness Engineering: Warum der Aufbau wichtiger ist als das KI-Modell

Die Kosten für KI steigen extrem an. Das liegt nicht an teuren KI-Modellen. Es liegt an der langen Arbeitszeit der KI-Agenten. KI-Agenten arbeiten heute oft tagelang oder wochenlang. Sie arbeiten ganz alleine. Sie merken sich sehr viele Informationen gleichzeitig. Dieser Informationsspeicher heißt Context Window. Ein einzelner Arbeitsauftrag verbraucht heute extrem viele Textbausteine. Diese Bausteine nennt man Tokens. Wiederholungen im System verbrauchen sehr viele Tokens. Wiederholungen kosten oft 50-mal so viel wie ein direkter Weg.

Das Wichtigste ist aber keine Frage des Geldes. Das KI-Modell entscheidet nicht über Erfolg oder Misserfolg. Der Aufbau rund um die KI ist das Wichtigste. Dieser Aufbau steuert den KI-Agenten.

Die wichtigste Aussage in diesem Text

Ab einem bestimmten Punkt ist der Aufbau wichtiger als das KI-Modell. Dieser Aufbau heißt Harness. Die Firma LangChain machte ihren Agenten viel besser. Der Agent machte weniger Fehler. Die Firma tauschte das KI-Modell dafür nicht aus. Sie veränderte nur die Arbeitsumgebung.

Für wen ist dieser Artikel?

Dieser Text ist für technische Abteilungsleiter. Er ist für Software-Architekten und Entwickler für TYPO3. Sie lernen hier die Wichtigkeit von Harness Engineering kennen. Harness Engineering meint den richtigen Aufbau für KI-Agenten. Sie erfahren hier Tipps für Ihre eigenen Projekte.

Inhaltsverzeichnis

Entwicklung

Von der Eingabe zum Aufbau

Kosten

Warum KI viel teurer wird

Harness Engineering

Der richtige Aufbau für KI

Plattformen

Systeme im Vergleich

Gute Qualität

Worauf Sie achten müssen

Forschung & Regeln

Regeln für die KI

TYPO3

Tipps für TYPO3 Projekte

Fazit

Zusammenfassung und Tipps

Von der Eingabe zum Aufbau

Die Arbeit mit KI hat sich in drei Stufen entwickelt. Jede neue Stufe löst Probleme der alten Stufe:

Prompt Engineering war die erste Stufe. Prompt ist das englische Wort für Eingabe. Menschen schrieben sehr genaue Eingaben für die KI. Die KI gab dafür eine gute Antwort zurück. Es war immer nur eine Frage und eine Antwort.

Context Engineering war die zweite Stufe. Context meint den Zusammenhang von Informationen. Experten verglichen das mit dem Arbeitsspeicher von einem Computer. Der Experte Tobi Lütke erklärte das genau. Man muss der KI alle wichtigen Informationen auf einmal geben. Nur dann löst die KI die Aufgabe richtig. Die Menschen achteten nicht mehr nur auf einen einzigen Satz. Sie gaben der KI viele Informationen aus dem Gesprächsverlauf mit.

Harness Engineering ist die dritte Stufe. Harness bedeutet auf Deutsch Halterung. Es meint hier den Aufbau rund um die KI. Diese Stufe steuert die KI über eine lange Zeit. Die Agenten behalten ihren Zustand bei. Sie reparieren Fehler und speichern ihren Fortschritt. Der Aufbau regelt den Einsatz von Werkzeugen. Er steuert auch das Gedächtnis der KI.

Feature	Prompt Engineering	Context Engineering	Harness Engineering
Fokus	Einzelne Eingabe	Gesamter Zusammenhang	Aufbau für lange Zeit
Vergleich	Einen guten Brief schreiben	Arbeitsspeicher aufräumen	Arbeitsplatz für Arbeiter bauen
Zeitraum	Eine Abfrage	Ein kurzes Gespräch	Stunden, Tage oder Wochen
Kontrolliert	Den genauen Text	Die mitgegebenen Informationen	Gedächtnis, Zustand und Fehler
Sinnbild	Eine gute Frage stellen	Den richtigen Rahmen geben	Die Schichtübergabe planen

Warum die Kosten für KI jetzt stark steigen

Die erste Generation von KI-Agenten arbeitete nur kurz. Man gab etwas ein und bekam eine Antwort. Das war alles. Die neuen KI-Agenten arbeiten ganz anders. Sie arbeiten tagelang oder wochenlang. Sie machen viele Dinge gleichzeitig. Sie nutzen sehr viele Informationen auf einmal.

Von Minuten zu Wochen

Das Programm Claude Code hat Agenten für den Hintergrund. Diese Agenten forschen und schreiben Code ganz alleine. Entwickler arbeiten in dieser Zeit an anderen Dingen. Claude hat auch Agenten-Teams. Mehrere Agenten arbeiten dabei gemeinsam an einem Projekt. Die Agenten sprechen direkt miteinander.

Warum die Kosten so hoch werden

KI-Agenten rufen das KI-Modell sehr oft auf. Sie brauchen viel mehr Aufrufe als normale Chatbots. Eine einzige Frage von einem Nutzer löst viele Dinge aus. Die KI plant, sucht Werkzeuge und prüft die Arbeit. Die Kosten steigen aus vier Gründen:

Die Regeln immer wiederholen

Die KI sendet die Grundregeln bei jeder Anfrage neu mit. Das verbraucht extrem viele Bausteine. Diese Textbausteine heißen Tokens. Die ständige Wiederholung verschlingt sehr viel Geld.

Teure Antworten

Die Antworten der KI kosten viel Geld. Sie kosten oft achtmal mehr als die Eingaben. Agenten erklären ihre Schritte oft sehr genau. Das kostet bei jedem Schritt sehr viel Geld.

Wiederholungen in Schleifen

Agenten prüfen ihre eigene Arbeit. Sie arbeiten oft in Schleifen. Jede Schleife kostet wieder Geld. Zwei Agenten lösen die gleiche Aufgabe oft ganz anders. Der Preis kann sich dadurch stark erhöhen.

Endlose Versuche

Agenten geben bei Fehlern nicht auf. Sie probieren es immer wieder. Sie ändern oft nur winzige Dinge. Jeder neue Versuch kostet wieder den vollen Preis.

Die Zahlen

Diese Tabelle zeigt die aktuellen Kosten für KI:

Art der Kosten	Preis	Quelle
Kosten Claude Code pro Tag	Etwa 6 Dollar pro Entwickler	Anthropic
Höchste Kosten pro Tag	Unter 12 Dollar	Anthropic
Kosten pro Team im Monat	100 bis 200 Dollar pro Entwickler	Anthropic
Preisunterschied bei gleicher Aufgabe	Bis zu zehnmal teurer	OpenReview
Kosten für große Firmen pro Jahr	50.000 bis 200.000 Dollar	TechAhead

So fließt das Geld bei vielen Agenten. Die Kosten steigen durch viele Wiederholungen stark an.

Was ist Agent Harness Engineering?

Agent Harness beschreibt den Aufbau rund um den KI-Agenten. Dieser Aufbau steuert den Agenten. Die Firma Anthropic hat das System genau beschrieben. Sie bemerkten ein großes Problem. Sogar die besten KI-Modelle scheitern an großen Projekten. Sie scheitern, wenn sie ohne diesen Aufbau arbeiten.

Das Hauptproblem

Denken Sie an ein großes Computerprojekt. Viele Arbeiter arbeiten nacheinander in Schichten. Ein neuer Arbeiter kommt zur Schicht. Er weiß aber nichts von der Arbeit davor. Genau so arbeiten KI-Agenten normalerweise. Ohne einen guten Aufbau gibt es zwei typische Fehler:

Alles auf einmal: Der Agent will das ganze Projekt sofort fertigstellen. Sein Arbeitsspeicher wird zu voll. Er hinterlässt unfertige Arbeit ohne Erklärungen.
Zu frühes Ende: Der Agent macht nur ein paar Aufgaben fertig. Dann sagt er einfach, das Projekt ist komplett beendet.

Die Lösung der Firma Anthropic in zwei Teilen

Anthropic löst das Problem mit einem zweigeteilten Aufbau:

Einrichter Agent – Erster Start

Erste Einrichtung: Ordner, Fortschritt und erste Speicherung anlegen

Programmierer Agent – Weitere Starts

Dies passiert bei jeder Schicht neu. Eine Aufgabe, einmal speichern.

Der erste Agent richtet die Umgebung ein. Er schreibt eine genaue Liste mit Aufgaben. Er erstellt eine Datei für den Fortschritt. Er bereitet den Speicherort vor.

Der zweite Agent macht die eigentliche Arbeit. Er liest immer zuerst den Fortschritt. Er startet die Umgebung und testet alles. Er erledigt dann genau eine einzige Aufgabe. Am Ende speichert er die Arbeit ab und notiert den Fortschritt.

Die fünf Säulen eines guten Aufbaus

Äußeres Gedächtnis

Die KI braucht einen Speicher außerhalb von ihrem Arbeitsspeicher. Sie braucht Listen für Aufgaben und Fortschritte. So erkennt die KI den Zustand des Projekts.

Zustand verwalten

Die KI muss ihren Fortschritt speichern. Sie muss ihn über Tage hinweg behalten. Sonst fängt der Agent immer wieder bei null an.

Fehler beheben

Die KI muss Fehler gut abfangen. Sie muss falsche Befehle erkennen. Sie muss kaputte Änderungen wieder rückgängig machen können.

Werkzeuge auswählen

Der Agent braucht die richtigen Werkzeuge. Jedes Werkzeug darf nur genau eine Aufgabe machen. Forscher haben das genau bewiesen.

Zusammenhänge steuern

Man muss den Arbeitsspeicher der KI aufräumen. Die KI darf nur die wichtigsten Informationen bekommen. Ein langsamer Fortschritt ist besser als zu viele Informationen auf einmal.

Plattformen in der Übersicht

Es gibt verschiedene Systeme für KI-Agenten. Wir zeigen hier drei ganz verschiedene Wege.

Factory AI: Software von Agenten

Die Plattform Factory AI nutzt ganz besondere Agenten. Sie nennt diese Agenten Droids. Es gibt einen Agenten für das Wissen und die Suche. Ein anderer Agent schreibt den Code. Ein dritter Agent sucht nach Fehlern. Der vierte Agent plant das Projekt.

Die Plattform arbeitet gut mit bekannten Programmen zusammen. Sie bietet großen Firmen viel Sicherheit.

Kritik von Nutzern

Nutzer berichten von schlechter Qualität. Der Code ist oft nicht gut. Menschen müssen den Code oft von Hand verbessern. Die KI verbraucht extrem viele Textbausteine. Manchmal verbraucht ein kleines Programmteil das ganze Testguthaben. Selbst einfache Aufgaben hatten bei Tests große Fehler.

Paperclip: Offenes System für ganz selbstständige Firmen

Das System Paperclip arbeitet ganz anders. Es ist ein offenes System. Es baut eine komplette Firma auf. Die Agenten haben Chefs und Mitarbeiter. Sie haben genaue Berufe und Aufgaben.

Das System weckt die Agenten in festen Abständen auf. Die Agenten prüfen dann ihre Arbeit. Chefs geben Aufgaben nach unten weiter. Jeder Agent bekommt ein festes Geld-Budget im Monat. Das System speichert jede einzelne Entscheidung. Das Programm ist sehr einfach gebaut.

Systeme im Vergleich

Diese Tabelle vergleicht die wichtigsten Systeme:

Merkmal	Factory AI	Paperclip	Claude Agenten	AutoGen
Ansatz	Besondere Agenten	Feste Berufe	Gemeinsame Schichten	Gespräche unter Agenten
Lizenz	Privat	Offener Code	Privat	Offener Code
Steuerung	Plattform steuert alles	Chefs geben Aufgaben weiter	Gemeinsame Aufgabenliste	Genaue Wege
Kontrolle über Geld	Begrenzte Bausteine	Festes Budget im Monat	Festes Limit für jeden Agenten	Keine echte Kontrolle
Reife	Früh	Früh	In der Testphase	Sehr stabil
Zielgruppe	Große Firmen	Selbstständige Firmen	Entwickler	Forscher und Entwickler

Woran erkennen Sie ein gutes System?

Ein guter Aufbau ist kein fertiges Produkt. Man muss diesen Aufbau selbst bauen. Gute Systeme haben bestimmte Merkmale. Schlechte Systeme kosten nur viel Geld.

Schrittweiser Fortschritt

Der Agent macht immer nur eine Aufgabe. Er versucht nie, das ganze Projekt auf einmal zu bauen. Das verhindert große Fehler.

Sauberer Zustand am Ende

Am Ende der Schicht muss alles funktionieren. Es darf keine Fehler geben. Alles muss gut beschrieben sein.

Automatische Prüfung

Die Agenten müssen ihre Arbeit testen. Ohne Tests sagen sie oft zu früh, dass sie fertig sind. Tests im Browser sind hier sehr wichtig.

Geordnete Dateien für den Fortschritt

Der Agent braucht genaue Listen. Er braucht Notizen und einen Verlauf der Arbeit. Das ist das Langzeitgedächtnis für den Agenten.

Kontrolle über die Kosten

Man muss dem Agenten ein festes Budget geben. Jeder kleine Agent braucht ein festes Limit. Das verhindert extreme Kosten.

Umgang mit Fehlern

Der Agent muss fehlerhafte Arbeit rückgängig machen können. Er muss kaputte Teile reparieren. Erst danach darf er neue Dinge bauen.

Evaluation: Ergebnisse messen, nicht den Weg

Anthropic hat Tipps für den Test von Agenten. Sie empfehlen einen einfachen Start. Man nimmt 20 bis 50 echte Fehler als Aufgaben. Das reicht für einen guten Test. Man bewertet den Agenten nach drei Punkten:

Säule	Was misst man?	Wie misst man?
Erfolg und Qualität	Ist die Aufgabe fertig? Ist das Ergebnis gut?	Programme testen den Code. Andere KIs bewerten das Ergebnis.
Arbeitsweg und Auswahl	Wie wählt der Agent sein Werkzeug?	Man schaut sich den Weg an. Man akzeptiert auch seltsame Wege bei gutem Ergebnis.
Vertrauen und Sicherheit	Arbeitet der Agent auch bei Problemen gut?	Man gibt dem Agenten extra schwierige Aufgaben. Man baut Fehler ein.

Bewerten Sie das Ergebnis, nicht den Weg

Die besten KI-Modelle finden oft ganz neue Wege. Diese Wege haben sich die Erfinder nicht ausgedacht. Messen Sie, was der Agent am Ende liefert. Messen Sie nicht, wie der Agent dorthin kommt. KI-Systeme wurden in einem Jahr unglaublich viel besser darin.

Ein anderes Programm zeigt einen wichtigen Trick. KI-Agenten brauchen keine bunten Oberflächen. Sie arbeiten besser mit direkten Schnittstellen. Das spart sehr viel Zeit und Arbeit.

Forschung und Regeln

Die Forschung zeigt eine klare Sache. KI-Agenten werden sehr schnell immer besser. Aber die Firmen haben keine guten Regeln dafür.

Der große Fortschritt

Ein Bericht der Universität Stanford zeigt einen Rekord. KI-Systeme wurden extrem schnell besser. Es gibt einen Test für Aufgaben beim Programmieren. Im Jahr 2023 löste die KI nur sehr wenige Aufgaben davon. Im Jahr 2024 löste die KI schon fast alle Aufgaben. Das ist ein sehr großer Fortschritt in nur einem Jahr.

Nutzung in Firmen und fehlende Regeln

Es gibt einen großen Unterschied. Sehr viele Firmen nutzen KI. Aber nur sehr wenige Firmen haben Regeln dafür.

Messwert	Ergebnis	Quelle
Firmen nutzen KI	78 Prozent	Stanford
Firmen testen KI-Agenten	62 Prozent	Deloitte
Firmen haben gute Regeln dafür	Nur 20 Prozent	Deloitte
Firmen haben echten Erfolg damit	Etwa 20 Prozent	McKinsey
Firmen ändern ihre Arbeit für KI	34 Prozent	Deloitte

Ein großer Bericht zeigt ein Problem. Viele Firmen nutzen KI. Aber sie haben keinen echten Erfolg damit. Der Grund dafür ist einfach. Sie nutzen KI nur als kleines Hilfsmittel. Sie nutzen KI noch nicht als echte Agenten.

Regeln von der Firma OpenAI

Die Firma OpenAI hat sieben wichtige Regeln aufgeschrieben. Diese Regeln helfen beim Einsatz von Agenten:

Klare Verantwortung – Menschen müssen für Schäden haften.
Handlungen mitschreiben – Man muss genau sehen, was der Agent tut.
Menschliche Freigabe – Menschen müssen wichtige Dinge erlauben.
Feste Grenzen – Der Agent darf nur bestimmte Dinge tun.
Langsamer Start – Man führt Agenten nur Schritt für Schritt ein.
Dinge rückgängig machen – Man muss Aktionen wieder löschen können.
Not-Aus Schalter – Man muss den Agenten sicher stoppen können.

Zusammenarbeit von vielen Agenten

Forscher lösen ein weiteres Problem. Viele Agenten müssen zusammenarbeiten. Die Agenten tauschen dafür nicht alle Informationen aus. Sie tauschen nur kurze Signale aus. Diese Signale zeigen mögliche Veränderungen an. Das Ergebnis ist sehr gut. Die Agenten arbeiten dadurch viel besser zusammen.

TYPO3-Projekte für KI-Agenten verbessern

Ein guter Aufbau hilft nicht nur bei neuen Projekten. Sie können auch alte TYPO3-Projekte gut vorbereiten. Die KI-Agenten arbeiten dann viel besser und genauer. Wir haben dazu einen eigenen langen Text geschrieben.

Hier sind die wichtigsten Punkte:

Hilfsmittel	Das fällt weg	Vorteil für die KI
Content Blocks	Verstreute Dateien	Nur noch eine Datei. Die KI liest das viel leichter.
PHP 8.4 Property Hooks	Lange Code-Zeilen	Viel weniger Text für jede Eigenschaft.
DataHandler	Direkte Datenbank-Änderungen	Arbeitsbereiche und Rechte funktionieren richtig.
Schema API	Komplizierte Zugriffe	Einfacher Code statt langer Suchwege.
Projekt-Regeln	Wissen in den Köpfen	Feste Regeln im Code helfen der KI sehr.
PHPStan	Menschliche Kontrolle	Automatische Kontrolle für den Code der KI.

Tiefer Einblick: TYPO3 und der richtige Aufbau

TYPO3 für KI fit machen

Der Kern von TYPO3 hilft der KI schon heute sehr. Sie können in Ihrem eigenen Projekt noch mehr tun. Unser Text zeigt Ihnen genau, wie das geht.

Zum ganzen Text

Fazit

Der richtige Aufbau für KI-Agenten ist extrem wichtig. Es ist kein leeres Modewort. Dieser Aufbau entscheidet über den Erfolg. Ohne diesen Aufbau kosten die Agenten nur viel Geld.

Im Jahr 2026 gewinnen nicht die Firmen mit den meisten Mitarbeitern. Es gewinnen die Firmen mit dem besten Aufbau für ihre KI-Agenten.

Wollen Sie Ihren eigenen Code prüfen? Möchten Sie wissen, was KI-Agenten heute noch bremst? Dann empfehlen wir eine genaue Prüfung von Ihrem Aufbau. Melden Sie sich gerne bei uns.

Agent Harness Engineering: Warum der Aufbau wichtiger ist als das KI-Modell

Auf einen Blick

Inhaltsverzeichnis

Von der Eingabe zum Aufbau

Warum die Kosten für KI jetzt stark steigen

Von Minuten zu Wochen

Warum die Kosten so hoch werden

Die Regeln immer wiederholen

Teure Antworten

Wiederholungen in Schleifen

Endlose Versuche

Die Zahlen

Was ist Agent Harness Engineering?

Das Hauptproblem

Die Lösung der Firma Anthropic in zwei Teilen

Einrichter Agent – Erster Start

Programmierer Agent – Weitere Starts

Die fünf Säulen eines guten Aufbaus

Äußeres Gedächtnis

Zustand verwalten

Fehler beheben

Werkzeuge auswählen

Zusammenhänge steuern

Plattformen in der Übersicht

Factory AI: Software von Agenten

Paperclip: Offenes System für ganz selbstständige Firmen

Systeme im Vergleich

Woran erkennen Sie ein gutes System?

Schrittweiser Fortschritt

Sauberer Zustand am Ende

Automatische Prüfung

Geordnete Dateien für den Fortschritt

Kontrolle über die Kosten

Umgang mit Fehlern

Evaluation: Ergebnisse messen, nicht den Weg

Forschung und Regeln

Der große Fortschritt

Nutzung in Firmen und fehlende Regeln

Regeln von der Firma OpenAI

Zusammenarbeit von vielen Agenten

TYPO3-Projekte für KI-Agenten verbessern

TYPO3 für KI fit machen

Fazit

Was ist Leichter Lesen?

Weitere Texte

AI Engineer Europe 2026: Qualität, Tempo, Open Source – 3 Wege für die Zukunft der Programmierung

Model Context Protocol: 30 Fragen und Antworten zum offenen Standard für die KI-Integration

Sprechen wir über Ihr Projekt.

Standorte