Agent Harness Engineering: Warum der Aufbau wichtiger ist als das KI-Modell

KI-Agenten arbeiten heute oft tagelang oder wochenlang. Sie arbeiten alleine und gleichzeitig. Der richtige Aufbau entscheidet über den Erfolg. Dieser Text erklärt Agent Harness Engineering. Er gibt auch Tipps für TYPO3.

Auf einen Blick

  • Das KI-Modell allein entscheidet nicht über den Erfolg. Der Aufbau rund um die KI ist viel wichtiger. Die Firma LangChain machte ihren KI-Agenten viel besser. Sie tauschten das KI-Modell dabei nicht aus. Sie veränderten nur die Arbeitsumgebung.
  • Wir sind bei der dritten Stufe der Entwicklung. Diese Stufe heißt Harness Engineering. Sie steuert die KI-Agenten über viele Tage hinweg. Die Agenten bekommen dadurch ein Gedächtnis. Sie erkennen Fehler und prüfen ihren eigenen Fortschritt.
  • KI-Agenten arbeiten nicht mehr nur 15 Minuten. Sie arbeiten tagelang und machen viele Dinge gleichzeitig. Das kostet heute etwa 200 Dollar im Monat für jede Fachkraft. Diese Kosten steigen bald stark an. Denn die Agenten arbeiten immer mehr gleichzeitig.
  • Viele Firmen testen KI-Agenten. Aber nur wenige Firmen haben klare Regeln dafür. Firmen brauchen einen guten Plan für den Einsatz. Sie brauchen Regeln für das Geld. Und sie müssen die Entscheidungen der KI kontrollieren.
  • Auch alte TYPO3-Projekte haben Vorteile davon. Klare Regeln im Code helfen den KI-Agenten. Die KI kann den Code dann viel besser lesen. Neue Techniken wie Content Blocks helfen dabei sehr.

Die Kosten für KI steigen extrem an. Das liegt nicht an teuren KI-Modellen. Es liegt an der langen Arbeitszeit der KI-Agenten. KI-Agenten arbeiten heute oft tagelang oder wochenlang. Sie arbeiten ganz alleine. Sie merken sich sehr viele Informationen gleichzeitig. Dieser Informationsspeicher heißt Context Window. Ein einzelner Arbeitsauftrag verbraucht heute extrem viele Textbausteine. Diese Bausteine nennt man Tokens. Wiederholungen im System verbrauchen sehr viele Tokens. Wiederholungen kosten oft 50-mal so viel wie ein direkter Weg.

Das Wichtigste ist aber keine Frage des Geldes. Das KI-Modell entscheidet nicht über Erfolg oder Misserfolg. Der Aufbau rund um die KI ist das Wichtigste. Dieser Aufbau steuert den KI-Agenten.

Die wichtigste Aussage in diesem Text

Ab einem bestimmten Punkt ist der Aufbau wichtiger als das KI-Modell. Dieser Aufbau heißt Harness. Die Firma LangChain machte ihren Agenten viel besser. Der Agent machte weniger Fehler. Die Firma tauschte das KI-Modell dafür nicht aus. Sie veränderte nur die Arbeitsumgebung.

Für wen ist dieser Artikel?

Dieser Text ist für technische Abteilungsleiter. Er ist für Software-Architekten und Entwickler für TYPO3. Sie lernen hier die Wichtigkeit von Harness Engineering kennen. Harness Engineering meint den richtigen Aufbau für KI-Agenten. Sie erfahren hier Tipps für Ihre eigenen Projekte.


Inhaltsverzeichnis  

Entwicklung

Von der Eingabe zum Aufbau

Kosten

Warum KI viel teurer wird

Harness Engineering

Der richtige Aufbau für KI

Plattformen

Systeme im Vergleich

Gute Qualität

Worauf Sie achten müssen

Forschung & Regeln

Regeln für die KI

TYPO3

Tipps für TYPO3 Projekte

Fazit

Zusammenfassung und Tipps


Von der Eingabe zum Aufbau  

Die Arbeit mit KI hat sich in drei Stufen entwickelt. Jede neue Stufe löst Probleme der alten Stufe:

Prompt Engineering war die erste Stufe. Prompt ist das englische Wort für Eingabe. Menschen schrieben sehr genaue Eingaben für die KI. Die KI gab dafür eine gute Antwort zurück. Es war immer nur eine Frage und eine Antwort.

Context Engineering war die zweite Stufe. Context meint den Zusammenhang von Informationen. Experten verglichen das mit dem Arbeitsspeicher von einem Computer. Der Experte Tobi Lütke erklärte das genau. Man muss der KI alle wichtigen Informationen auf einmal geben. Nur dann löst die KI die Aufgabe richtig. Die Menschen achteten nicht mehr nur auf einen einzigen Satz. Sie gaben der KI viele Informationen aus dem Gesprächsverlauf mit.

Harness Engineering ist die dritte Stufe. Harness bedeutet auf Deutsch Halterung. Es meint hier den Aufbau rund um die KI. Diese Stufe steuert die KI über eine lange Zeit. Die Agenten behalten ihren Zustand bei. Sie reparieren Fehler und speichern ihren Fortschritt. Der Aufbau regelt den Einsatz von Werkzeugen. Er steuert auch das Gedächtnis der KI.

FeaturePrompt EngineeringContext EngineeringHarness Engineering
FokusEinzelne EingabeGesamter ZusammenhangAufbau für lange Zeit
VergleichEinen guten Brief schreibenArbeitsspeicher aufräumenArbeitsplatz für Arbeiter bauen
ZeitraumEine AbfrageEin kurzes GesprächStunden, Tage oder Wochen
KontrolliertDen genauen TextDie mitgegebenen InformationenGedächtnis, Zustand und Fehler
SinnbildEine gute Frage stellenDen richtigen Rahmen gebenDie Schichtübergabe planen

Warum die Kosten für KI jetzt stark steigen  

Die erste Generation von KI-Agenten arbeitete nur kurz. Man gab etwas ein und bekam eine Antwort. Das war alles. Die neuen KI-Agenten arbeiten ganz anders. Sie arbeiten tagelang oder wochenlang. Sie machen viele Dinge gleichzeitig. Sie nutzen sehr viele Informationen auf einmal.

Von Minuten zu Wochen  

Das Programm Claude Code hat Agenten für den Hintergrund. Diese Agenten forschen und schreiben Code ganz alleine. Entwickler arbeiten in dieser Zeit an anderen Dingen. Claude hat auch Agenten-Teams. Mehrere Agenten arbeiten dabei gemeinsam an einem Projekt. Die Agenten sprechen direkt miteinander.

Warum die Kosten so hoch werden  

KI-Agenten rufen das KI-Modell sehr oft auf. Sie brauchen viel mehr Aufrufe als normale Chatbots. Eine einzige Frage von einem Nutzer löst viele Dinge aus. Die KI plant, sucht Werkzeuge und prüft die Arbeit. Die Kosten steigen aus vier Gründen:

Die Regeln immer wiederholen

Die KI sendet die Grundregeln bei jeder Anfrage neu mit. Das verbraucht extrem viele Bausteine. Diese Textbausteine heißen Tokens. Die ständige Wiederholung verschlingt sehr viel Geld.

Teure Antworten

Die Antworten der KI kosten viel Geld. Sie kosten oft achtmal mehr als die Eingaben. Agenten erklären ihre Schritte oft sehr genau. Das kostet bei jedem Schritt sehr viel Geld.

Wiederholungen in Schleifen

Agenten prüfen ihre eigene Arbeit. Sie arbeiten oft in Schleifen. Jede Schleife kostet wieder Geld. Zwei Agenten lösen die gleiche Aufgabe oft ganz anders. Der Preis kann sich dadurch stark erhöhen.

Endlose Versuche

Agenten geben bei Fehlern nicht auf. Sie probieren es immer wieder. Sie ändern oft nur winzige Dinge. Jeder neue Versuch kostet wieder den vollen Preis.

Die Zahlen  

Diese Tabelle zeigt die aktuellen Kosten für KI:

Art der KostenPreisQuelle
Kosten Claude Code pro TagEtwa 6 Dollar pro EntwicklerAnthropic
Höchste Kosten pro TagUnter 12 DollarAnthropic
Kosten pro Team im Monat100 bis 200 Dollar pro EntwicklerAnthropic
Preisunterschied bei gleicher AufgabeBis zu zehnmal teurerOpenReview
Kosten für große Firmen pro Jahr50.000 bis 200.000 DollarTechAhead

So fließt das Geld bei vielen Agenten. Die Kosten steigen durch viele Wiederholungen stark an.


Was ist Agent Harness Engineering?  

Agent Harness beschreibt den Aufbau rund um den KI-Agenten. Dieser Aufbau steuert den Agenten. Die Firma Anthropic hat das System genau beschrieben. Sie bemerkten ein großes Problem. Sogar die besten KI-Modelle scheitern an großen Projekten. Sie scheitern, wenn sie ohne diesen Aufbau arbeiten.

Das Hauptproblem  

Denken Sie an ein großes Computerprojekt. Viele Arbeiter arbeiten nacheinander in Schichten. Ein neuer Arbeiter kommt zur Schicht. Er weiß aber nichts von der Arbeit davor. Genau so arbeiten KI-Agenten normalerweise. Ohne einen guten Aufbau gibt es zwei typische Fehler:

  1. Alles auf einmal: Der Agent will das ganze Projekt sofort fertigstellen. Sein Arbeitsspeicher wird zu voll. Er hinterlässt unfertige Arbeit ohne Erklärungen.
  2. Zu frühes Ende: Der Agent macht nur ein paar Aufgaben fertig. Dann sagt er einfach, das Projekt ist komplett beendet.

Die Lösung der Firma Anthropic in zwei Teilen  

Anthropic löst das Problem mit einem zweigeteilten Aufbau:

Einrichter Agent – Erster Start

Erste Einrichtung: Ordner, Fortschritt und erste Speicherung anlegen

Programmierer Agent – Weitere Starts

Dies passiert bei jeder Schicht neu. Eine Aufgabe, einmal speichern.

Der erste Agent richtet die Umgebung ein. Er schreibt eine genaue Liste mit Aufgaben. Er erstellt eine Datei für den Fortschritt. Er bereitet den Speicherort vor.

Der zweite Agent macht die eigentliche Arbeit. Er liest immer zuerst den Fortschritt. Er startet die Umgebung und testet alles. Er erledigt dann genau eine einzige Aufgabe. Am Ende speichert er die Arbeit ab und notiert den Fortschritt.

Die fünf Säulen eines guten Aufbaus  

Äußeres Gedächtnis

Die KI braucht einen Speicher außerhalb von ihrem Arbeitsspeicher. Sie braucht Listen für Aufgaben und Fortschritte. So erkennt die KI den Zustand des Projekts.

Zustand verwalten

Die KI muss ihren Fortschritt speichern. Sie muss ihn über Tage hinweg behalten. Sonst fängt der Agent immer wieder bei null an.

Fehler beheben

Die KI muss Fehler gut abfangen. Sie muss falsche Befehle erkennen. Sie muss kaputte Änderungen wieder rückgängig machen können.

Werkzeuge auswählen

Der Agent braucht die richtigen Werkzeuge. Jedes Werkzeug darf nur genau eine Aufgabe machen. Forscher haben das genau bewiesen.

Zusammenhänge steuern

Man muss den Arbeitsspeicher der KI aufräumen. Die KI darf nur die wichtigsten Informationen bekommen. Ein langsamer Fortschritt ist besser als zu viele Informationen auf einmal.


Plattformen in der Übersicht  

Es gibt verschiedene Systeme für KI-Agenten. Wir zeigen hier drei ganz verschiedene Wege.

Factory AI: Software von Agenten  

Die Plattform Factory AI nutzt ganz besondere Agenten. Sie nennt diese Agenten Droids. Es gibt einen Agenten für das Wissen und die Suche. Ein anderer Agent schreibt den Code. Ein dritter Agent sucht nach Fehlern. Der vierte Agent plant das Projekt.

Die Plattform arbeitet gut mit bekannten Programmen zusammen. Sie bietet großen Firmen viel Sicherheit.

Kritik von Nutzern

Nutzer berichten von schlechter Qualität. Der Code ist oft nicht gut. Menschen müssen den Code oft von Hand verbessern. Die KI verbraucht extrem viele Textbausteine. Manchmal verbraucht ein kleines Programmteil das ganze Testguthaben. Selbst einfache Aufgaben hatten bei Tests große Fehler.

Paperclip: Offenes System für ganz selbstständige Firmen  

Das System Paperclip arbeitet ganz anders. Es ist ein offenes System. Es baut eine komplette Firma auf. Die Agenten haben Chefs und Mitarbeiter. Sie haben genaue Berufe und Aufgaben.

Das System weckt die Agenten in festen Abständen auf. Die Agenten prüfen dann ihre Arbeit. Chefs geben Aufgaben nach unten weiter. Jeder Agent bekommt ein festes Geld-Budget im Monat. Das System speichert jede einzelne Entscheidung. Das Programm ist sehr einfach gebaut.

Systeme im Vergleich  

Diese Tabelle vergleicht die wichtigsten Systeme:

MerkmalFactory AIPaperclipClaude AgentenAutoGen
AnsatzBesondere AgentenFeste BerufeGemeinsame SchichtenGespräche unter Agenten
LizenzPrivatOffener CodePrivatOffener Code
SteuerungPlattform steuert allesChefs geben Aufgaben weiterGemeinsame AufgabenlisteGenaue Wege
Kontrolle über GeldBegrenzte BausteineFestes Budget im MonatFestes Limit für jeden AgentenKeine echte Kontrolle
ReifeFrühFrühIn der TestphaseSehr stabil
ZielgruppeGroße FirmenSelbstständige FirmenEntwicklerForscher und Entwickler

Woran erkennen Sie ein gutes System?  

Ein guter Aufbau ist kein fertiges Produkt. Man muss diesen Aufbau selbst bauen. Gute Systeme haben bestimmte Merkmale. Schlechte Systeme kosten nur viel Geld.

Schrittweiser Fortschritt

Der Agent macht immer nur eine Aufgabe. Er versucht nie, das ganze Projekt auf einmal zu bauen. Das verhindert große Fehler.

Sauberer Zustand am Ende

Am Ende der Schicht muss alles funktionieren. Es darf keine Fehler geben. Alles muss gut beschrieben sein.

Automatische Prüfung

Die Agenten müssen ihre Arbeit testen. Ohne Tests sagen sie oft zu früh, dass sie fertig sind. Tests im Browser sind hier sehr wichtig.

Geordnete Dateien für den Fortschritt

Der Agent braucht genaue Listen. Er braucht Notizen und einen Verlauf der Arbeit. Das ist das Langzeitgedächtnis für den Agenten.

Kontrolle über die Kosten

Man muss dem Agenten ein festes Budget geben. Jeder kleine Agent braucht ein festes Limit. Das verhindert extreme Kosten.

Umgang mit Fehlern

Der Agent muss fehlerhafte Arbeit rückgängig machen können. Er muss kaputte Teile reparieren. Erst danach darf er neue Dinge bauen.

Evaluation: Ergebnisse messen, nicht den Weg  

Anthropic hat Tipps für den Test von Agenten. Sie empfehlen einen einfachen Start. Man nimmt 20 bis 50 echte Fehler als Aufgaben. Das reicht für einen guten Test. Man bewertet den Agenten nach drei Punkten:

SäuleWas misst man?Wie misst man?
Erfolg und QualitätIst die Aufgabe fertig? Ist das Ergebnis gut?Programme testen den Code. Andere KIs bewerten das Ergebnis.
Arbeitsweg und AuswahlWie wählt der Agent sein Werkzeug?Man schaut sich den Weg an. Man akzeptiert auch seltsame Wege bei gutem Ergebnis.
Vertrauen und SicherheitArbeitet der Agent auch bei Problemen gut?Man gibt dem Agenten extra schwierige Aufgaben. Man baut Fehler ein.
Bewerten Sie das Ergebnis, nicht den Weg

Die besten KI-Modelle finden oft ganz neue Wege. Diese Wege haben sich die Erfinder nicht ausgedacht. Messen Sie, was der Agent am Ende liefert. Messen Sie nicht, wie der Agent dorthin kommt. KI-Systeme wurden in einem Jahr unglaublich viel besser darin.

Ein anderes Programm zeigt einen wichtigen Trick. KI-Agenten brauchen keine bunten Oberflächen. Sie arbeiten besser mit direkten Schnittstellen. Das spart sehr viel Zeit und Arbeit.


Forschung und Regeln  

Die Forschung zeigt eine klare Sache. KI-Agenten werden sehr schnell immer besser. Aber die Firmen haben keine guten Regeln dafür.

Der große Fortschritt  

Ein Bericht der Universität Stanford zeigt einen Rekord. KI-Systeme wurden extrem schnell besser. Es gibt einen Test für Aufgaben beim Programmieren. Im Jahr 2023 löste die KI nur sehr wenige Aufgaben davon. Im Jahr 2024 löste die KI schon fast alle Aufgaben. Das ist ein sehr großer Fortschritt in nur einem Jahr.

Nutzung in Firmen und fehlende Regeln  

Es gibt einen großen Unterschied. Sehr viele Firmen nutzen KI. Aber nur sehr wenige Firmen haben Regeln dafür.

MesswertErgebnisQuelle
Firmen nutzen KI78 ProzentStanford
Firmen testen KI-Agenten62 ProzentDeloitte
Firmen haben gute Regeln dafürNur 20 ProzentDeloitte
Firmen haben echten Erfolg damitEtwa 20 ProzentMcKinsey
Firmen ändern ihre Arbeit für KI34 ProzentDeloitte

Ein großer Bericht zeigt ein Problem. Viele Firmen nutzen KI. Aber sie haben keinen echten Erfolg damit. Der Grund dafür ist einfach. Sie nutzen KI nur als kleines Hilfsmittel. Sie nutzen KI noch nicht als echte Agenten.

Regeln von der Firma OpenAI  

Die Firma OpenAI hat sieben wichtige Regeln aufgeschrieben. Diese Regeln helfen beim Einsatz von Agenten:

  1. Klare Verantwortung – Menschen müssen für Schäden haften.
  2. Handlungen mitschreiben – Man muss genau sehen, was der Agent tut.
  3. Menschliche Freigabe – Menschen müssen wichtige Dinge erlauben.
  4. Feste Grenzen – Der Agent darf nur bestimmte Dinge tun.
  5. Langsamer Start – Man führt Agenten nur Schritt für Schritt ein.
  6. Dinge rückgängig machen – Man muss Aktionen wieder löschen können.
  7. Not-Aus Schalter – Man muss den Agenten sicher stoppen können.

Zusammenarbeit von vielen Agenten  

Forscher lösen ein weiteres Problem. Viele Agenten müssen zusammenarbeiten. Die Agenten tauschen dafür nicht alle Informationen aus. Sie tauschen nur kurze Signale aus. Diese Signale zeigen mögliche Veränderungen an. Das Ergebnis ist sehr gut. Die Agenten arbeiten dadurch viel besser zusammen.


TYPO3-Projekte für KI-Agenten verbessern  

Ein guter Aufbau hilft nicht nur bei neuen Projekten. Sie können auch alte TYPO3-Projekte gut vorbereiten. Die KI-Agenten arbeiten dann viel besser und genauer. Wir haben dazu einen eigenen langen Text geschrieben.

Hier sind die wichtigsten Punkte:

HilfsmittelDas fällt wegVorteil für die KI
Content BlocksVerstreute DateienNur noch eine Datei. Die KI liest das viel leichter.
PHP 8.4 Property HooksLange Code-ZeilenViel weniger Text für jede Eigenschaft.
DataHandlerDirekte Datenbank-ÄnderungenArbeitsbereiche und Rechte funktionieren richtig.
Schema APIKomplizierte ZugriffeEinfacher Code statt langer Suchwege.
Projekt-RegelnWissen in den KöpfenFeste Regeln im Code helfen der KI sehr.
PHPStanMenschliche KontrolleAutomatische Kontrolle für den Code der KI.
Tiefer Einblick: TYPO3 und der richtige Aufbau

TYPO3 für KI fit machen

Der Kern von TYPO3 hilft der KI schon heute sehr. Sie können in Ihrem eigenen Projekt noch mehr tun. Unser Text zeigt Ihnen genau, wie das geht.

Zum ganzen Text

Fazit  

Der richtige Aufbau für KI-Agenten ist extrem wichtig. Es ist kein leeres Modewort. Dieser Aufbau entscheidet über den Erfolg. Ohne diesen Aufbau kosten die Agenten nur viel Geld.

Im Jahr 2026 gewinnen nicht die Firmen mit den meisten Mitarbeitern. Es gewinnen die Firmen mit dem besten Aufbau für ihre KI-Agenten.

Wollen Sie Ihren eigenen Code prüfen? Möchten Sie wissen, was KI-Agenten heute noch bremst? Dann empfehlen wir eine genaue Prüfung von Ihrem Aufbau. Melden Sie sich gerne bei uns.

Was ist Leichter Lesen?

A2

Diese Seite ist in Leichter Sprache geschrieben. Leichte Sprache hilft vielen Menschen, Texte besser zu verstehen. Die Sätze sind kurz. Schwierige Wörter werden erklärt.

Dieser Text wurde nach den Regeln der Leichten Sprache erstellt. Textniveau: A2 (Gemeinsamer Europäischer Referenzrahmen).

Lassen Sie uns ueber Ihr Projekt sprechen

Standorte

  • Mattersburg
    Johann Nepomuk Bergerstraße 7/2/14
    7210 Mattersburg, Austria
  • Wien
    Ungargasse 64-66/3/404
    1030 Wien, Austria

Dieser Inhalt wurde teilweise mithilfe von KI erstellt.