Die Kosten für KI steigen extrem an. Das liegt nicht an teuren KI-Modellen. Es liegt an der langen Arbeitszeit der KI-Agenten. KI-Agenten arbeiten heute oft tagelang oder wochenlang. Sie arbeiten ganz alleine. Sie merken sich sehr viele Informationen gleichzeitig. Dieser Informationsspeicher heißt Context Window. Ein einzelner Arbeitsauftrag verbraucht heute extrem viele Textbausteine. Diese Bausteine nennt man Tokens. Wiederholungen im System verbrauchen sehr viele Tokens. Wiederholungen kosten oft 50-mal so viel wie ein direkter Weg.
Das Wichtigste ist aber keine Frage des Geldes. Das KI-Modell entscheidet nicht über Erfolg oder Misserfolg. Der Aufbau rund um die KI ist das Wichtigste. Dieser Aufbau steuert den KI-Agenten.
Ab einem bestimmten Punkt ist der Aufbau wichtiger als das KI-Modell. Dieser Aufbau heißt Harness. Die Firma LangChain machte ihren Agenten viel besser. Der Agent machte weniger Fehler. Die Firma tauschte das KI-Modell dafür nicht aus. Sie veränderte nur die Arbeitsumgebung.
Dieser Text ist für technische Abteilungsleiter. Er ist für Software-Architekten und Entwickler für TYPO3. Sie lernen hier die Wichtigkeit von Harness Engineering kennen. Harness Engineering meint den richtigen Aufbau für KI-Agenten. Sie erfahren hier Tipps für Ihre eigenen Projekte.
Inhaltsverzeichnis
Entwicklung
Von der Eingabe zum Aufbau
Kosten
Warum KI viel teurer wird
Harness Engineering
Der richtige Aufbau für KI
Plattformen
Systeme im Vergleich
Gute Qualität
Worauf Sie achten müssen
Forschung & Regeln
Regeln für die KI
TYPO3
Tipps für TYPO3 Projekte
Fazit
Zusammenfassung und Tipps
Von der Eingabe zum Aufbau
Die Arbeit mit KI hat sich in drei Stufen entwickelt. Jede neue Stufe löst Probleme der alten Stufe:
Prompt Engineering war die erste Stufe. Prompt ist das englische Wort für Eingabe. Menschen schrieben sehr genaue Eingaben für die KI. Die KI gab dafür eine gute Antwort zurück. Es war immer nur eine Frage und eine Antwort.
Context Engineering war die zweite Stufe. Context meint den Zusammenhang von Informationen. Experten verglichen das mit dem Arbeitsspeicher von einem Computer. Der Experte Tobi Lütke erklärte das genau. Man muss der KI alle wichtigen Informationen auf einmal geben. Nur dann löst die KI die Aufgabe richtig. Die Menschen achteten nicht mehr nur auf einen einzigen Satz. Sie gaben der KI viele Informationen aus dem Gesprächsverlauf mit.
Harness Engineering ist die dritte Stufe. Harness bedeutet auf Deutsch Halterung. Es meint hier den Aufbau rund um die KI. Diese Stufe steuert die KI über eine lange Zeit. Die Agenten behalten ihren Zustand bei. Sie reparieren Fehler und speichern ihren Fortschritt. Der Aufbau regelt den Einsatz von Werkzeugen. Er steuert auch das Gedächtnis der KI.
| Feature | Prompt Engineering | Context Engineering | Harness Engineering |
|---|---|---|---|
| Fokus | Einzelne Eingabe | Gesamter Zusammenhang | Aufbau für lange Zeit |
| Vergleich | Einen guten Brief schreiben | Arbeitsspeicher aufräumen | Arbeitsplatz für Arbeiter bauen |
| Zeitraum | Eine Abfrage | Ein kurzes Gespräch | Stunden, Tage oder Wochen |
| Kontrolliert | Den genauen Text | Die mitgegebenen Informationen | Gedächtnis, Zustand und Fehler |
| Sinnbild | Eine gute Frage stellen | Den richtigen Rahmen geben | Die Schichtübergabe planen |
Warum die Kosten für KI jetzt stark steigen
Die erste Generation von KI-Agenten arbeitete nur kurz. Man gab etwas ein und bekam eine Antwort. Das war alles. Die neuen KI-Agenten arbeiten ganz anders. Sie arbeiten tagelang oder wochenlang. Sie machen viele Dinge gleichzeitig. Sie nutzen sehr viele Informationen auf einmal.
Von Minuten zu Wochen
Das Programm Claude Code hat Agenten für den Hintergrund. Diese Agenten forschen und schreiben Code ganz alleine. Entwickler arbeiten in dieser Zeit an anderen Dingen. Claude hat auch Agenten-Teams. Mehrere Agenten arbeiten dabei gemeinsam an einem Projekt. Die Agenten sprechen direkt miteinander.
Warum die Kosten so hoch werden
KI-Agenten rufen das KI-Modell sehr oft auf. Sie brauchen viel mehr Aufrufe als normale Chatbots. Eine einzige Frage von einem Nutzer löst viele Dinge aus. Die KI plant, sucht Werkzeuge und prüft die Arbeit. Die Kosten steigen aus vier Gründen:
Die Regeln immer wiederholen
Die KI sendet die Grundregeln bei jeder Anfrage neu mit. Das verbraucht extrem viele Bausteine. Diese Textbausteine heißen Tokens. Die ständige Wiederholung verschlingt sehr viel Geld.
Teure Antworten
Die Antworten der KI kosten viel Geld. Sie kosten oft achtmal mehr als die Eingaben. Agenten erklären ihre Schritte oft sehr genau. Das kostet bei jedem Schritt sehr viel Geld.
Wiederholungen in Schleifen
Agenten prüfen ihre eigene Arbeit. Sie arbeiten oft in Schleifen. Jede Schleife kostet wieder Geld. Zwei Agenten lösen die gleiche Aufgabe oft ganz anders. Der Preis kann sich dadurch stark erhöhen.
Endlose Versuche
Agenten geben bei Fehlern nicht auf. Sie probieren es immer wieder. Sie ändern oft nur winzige Dinge. Jeder neue Versuch kostet wieder den vollen Preis.
Die Zahlen
Diese Tabelle zeigt die aktuellen Kosten für KI:
| Art der Kosten | Preis | Quelle |
|---|---|---|
| Kosten Claude Code pro Tag | Etwa 6 Dollar pro Entwickler | Anthropic |
| Höchste Kosten pro Tag | Unter 12 Dollar | Anthropic |
| Kosten pro Team im Monat | 100 bis 200 Dollar pro Entwickler | Anthropic |
| Preisunterschied bei gleicher Aufgabe | Bis zu zehnmal teurer | OpenReview |
| Kosten für große Firmen pro Jahr | 50.000 bis 200.000 Dollar | TechAhead |
So fließt das Geld bei vielen Agenten. Die Kosten steigen durch viele Wiederholungen stark an.
Was ist Agent Harness Engineering?
Agent Harness beschreibt den Aufbau rund um den KI-Agenten. Dieser Aufbau steuert den Agenten. Die Firma Anthropic hat das System genau beschrieben. Sie bemerkten ein großes Problem. Sogar die besten KI-Modelle scheitern an großen Projekten. Sie scheitern, wenn sie ohne diesen Aufbau arbeiten.
Das Hauptproblem
Denken Sie an ein großes Computerprojekt. Viele Arbeiter arbeiten nacheinander in Schichten. Ein neuer Arbeiter kommt zur Schicht. Er weiß aber nichts von der Arbeit davor. Genau so arbeiten KI-Agenten normalerweise. Ohne einen guten Aufbau gibt es zwei typische Fehler:
- Alles auf einmal: Der Agent will das ganze Projekt sofort fertigstellen. Sein Arbeitsspeicher wird zu voll. Er hinterlässt unfertige Arbeit ohne Erklärungen.
- Zu frühes Ende: Der Agent macht nur ein paar Aufgaben fertig. Dann sagt er einfach, das Projekt ist komplett beendet.
Die Lösung der Firma Anthropic in zwei Teilen
Anthropic löst das Problem mit einem zweigeteilten Aufbau:
Einrichter Agent – Erster Start
Erste Einrichtung: Ordner, Fortschritt und erste Speicherung anlegen
Programmierer Agent – Weitere Starts
Dies passiert bei jeder Schicht neu. Eine Aufgabe, einmal speichern.
Der erste Agent richtet die Umgebung ein. Er schreibt eine genaue Liste mit Aufgaben. Er erstellt eine Datei für den Fortschritt. Er bereitet den Speicherort vor.
Der zweite Agent macht die eigentliche Arbeit. Er liest immer zuerst den Fortschritt. Er startet die Umgebung und testet alles. Er erledigt dann genau eine einzige Aufgabe. Am Ende speichert er die Arbeit ab und notiert den Fortschritt.
Die fünf Säulen eines guten Aufbaus
Äußeres Gedächtnis
Die KI braucht einen Speicher außerhalb von ihrem Arbeitsspeicher. Sie braucht Listen für Aufgaben und Fortschritte. So erkennt die KI den Zustand des Projekts.
Zustand verwalten
Die KI muss ihren Fortschritt speichern. Sie muss ihn über Tage hinweg behalten. Sonst fängt der Agent immer wieder bei null an.
Fehler beheben
Die KI muss Fehler gut abfangen. Sie muss falsche Befehle erkennen. Sie muss kaputte Änderungen wieder rückgängig machen können.
Werkzeuge auswählen
Der Agent braucht die richtigen Werkzeuge. Jedes Werkzeug darf nur genau eine Aufgabe machen. Forscher haben das genau bewiesen.
Zusammenhänge steuern
Man muss den Arbeitsspeicher der KI aufräumen. Die KI darf nur die wichtigsten Informationen bekommen. Ein langsamer Fortschritt ist besser als zu viele Informationen auf einmal.
Plattformen in der Übersicht
Es gibt verschiedene Systeme für KI-Agenten. Wir zeigen hier drei ganz verschiedene Wege.
Factory AI: Software von Agenten
Die Plattform Factory AI nutzt ganz besondere Agenten. Sie nennt diese Agenten Droids. Es gibt einen Agenten für das Wissen und die Suche. Ein anderer Agent schreibt den Code. Ein dritter Agent sucht nach Fehlern. Der vierte Agent plant das Projekt.
Die Plattform arbeitet gut mit bekannten Programmen zusammen. Sie bietet großen Firmen viel Sicherheit.
Nutzer berichten von schlechter Qualität. Der Code ist oft nicht gut. Menschen müssen den Code oft von Hand verbessern. Die KI verbraucht extrem viele Textbausteine. Manchmal verbraucht ein kleines Programmteil das ganze Testguthaben. Selbst einfache Aufgaben hatten bei Tests große Fehler.
Paperclip: Offenes System für ganz selbstständige Firmen
Das System Paperclip arbeitet ganz anders. Es ist ein offenes System. Es baut eine komplette Firma auf. Die Agenten haben Chefs und Mitarbeiter. Sie haben genaue Berufe und Aufgaben.
Das System weckt die Agenten in festen Abständen auf. Die Agenten prüfen dann ihre Arbeit. Chefs geben Aufgaben nach unten weiter. Jeder Agent bekommt ein festes Geld-Budget im Monat. Das System speichert jede einzelne Entscheidung. Das Programm ist sehr einfach gebaut.
Systeme im Vergleich
Diese Tabelle vergleicht die wichtigsten Systeme:
| Merkmal | Factory AI | Paperclip | Claude Agenten | AutoGen |
|---|---|---|---|---|
| Ansatz | Besondere Agenten | Feste Berufe | Gemeinsame Schichten | Gespräche unter Agenten |
| Lizenz | Privat | Offener Code | Privat | Offener Code |
| Steuerung | Plattform steuert alles | Chefs geben Aufgaben weiter | Gemeinsame Aufgabenliste | Genaue Wege |
| Kontrolle über Geld | Begrenzte Bausteine | Festes Budget im Monat | Festes Limit für jeden Agenten | Keine echte Kontrolle |
| Reife | Früh | Früh | In der Testphase | Sehr stabil |
| Zielgruppe | Große Firmen | Selbstständige Firmen | Entwickler | Forscher und Entwickler |
Woran erkennen Sie ein gutes System?
Ein guter Aufbau ist kein fertiges Produkt. Man muss diesen Aufbau selbst bauen. Gute Systeme haben bestimmte Merkmale. Schlechte Systeme kosten nur viel Geld.
Schrittweiser Fortschritt
Der Agent macht immer nur eine Aufgabe. Er versucht nie, das ganze Projekt auf einmal zu bauen. Das verhindert große Fehler.
Sauberer Zustand am Ende
Am Ende der Schicht muss alles funktionieren. Es darf keine Fehler geben. Alles muss gut beschrieben sein.
Automatische Prüfung
Die Agenten müssen ihre Arbeit testen. Ohne Tests sagen sie oft zu früh, dass sie fertig sind. Tests im Browser sind hier sehr wichtig.
Geordnete Dateien für den Fortschritt
Der Agent braucht genaue Listen. Er braucht Notizen und einen Verlauf der Arbeit. Das ist das Langzeitgedächtnis für den Agenten.
Kontrolle über die Kosten
Man muss dem Agenten ein festes Budget geben. Jeder kleine Agent braucht ein festes Limit. Das verhindert extreme Kosten.
Umgang mit Fehlern
Der Agent muss fehlerhafte Arbeit rückgängig machen können. Er muss kaputte Teile reparieren. Erst danach darf er neue Dinge bauen.
Evaluation: Ergebnisse messen, nicht den Weg
Anthropic hat Tipps für den Test von Agenten. Sie empfehlen einen einfachen Start. Man nimmt 20 bis 50 echte Fehler als Aufgaben. Das reicht für einen guten Test. Man bewertet den Agenten nach drei Punkten:
| Säule | Was misst man? | Wie misst man? |
|---|---|---|
| Erfolg und Qualität | Ist die Aufgabe fertig? Ist das Ergebnis gut? | Programme testen den Code. Andere KIs bewerten das Ergebnis. |
| Arbeitsweg und Auswahl | Wie wählt der Agent sein Werkzeug? | Man schaut sich den Weg an. Man akzeptiert auch seltsame Wege bei gutem Ergebnis. |
| Vertrauen und Sicherheit | Arbeitet der Agent auch bei Problemen gut? | Man gibt dem Agenten extra schwierige Aufgaben. Man baut Fehler ein. |
Die besten KI-Modelle finden oft ganz neue Wege. Diese Wege haben sich die Erfinder nicht ausgedacht. Messen Sie, was der Agent am Ende liefert. Messen Sie nicht, wie der Agent dorthin kommt. KI-Systeme wurden in einem Jahr unglaublich viel besser darin.
Ein anderes Programm zeigt einen wichtigen Trick. KI-Agenten brauchen keine bunten Oberflächen. Sie arbeiten besser mit direkten Schnittstellen. Das spart sehr viel Zeit und Arbeit.
Forschung und Regeln
Die Forschung zeigt eine klare Sache. KI-Agenten werden sehr schnell immer besser. Aber die Firmen haben keine guten Regeln dafür.
Der große Fortschritt
Ein Bericht der Universität Stanford zeigt einen Rekord. KI-Systeme wurden extrem schnell besser. Es gibt einen Test für Aufgaben beim Programmieren. Im Jahr 2023 löste die KI nur sehr wenige Aufgaben davon. Im Jahr 2024 löste die KI schon fast alle Aufgaben. Das ist ein sehr großer Fortschritt in nur einem Jahr.
Nutzung in Firmen und fehlende Regeln
Es gibt einen großen Unterschied. Sehr viele Firmen nutzen KI. Aber nur sehr wenige Firmen haben Regeln dafür.
| Messwert | Ergebnis | Quelle |
|---|---|---|
| Firmen nutzen KI | 78 Prozent | Stanford |
| Firmen testen KI-Agenten | 62 Prozent | Deloitte |
| Firmen haben gute Regeln dafür | Nur 20 Prozent | Deloitte |
| Firmen haben echten Erfolg damit | Etwa 20 Prozent | McKinsey |
| Firmen ändern ihre Arbeit für KI | 34 Prozent | Deloitte |
Ein großer Bericht zeigt ein Problem. Viele Firmen nutzen KI. Aber sie haben keinen echten Erfolg damit. Der Grund dafür ist einfach. Sie nutzen KI nur als kleines Hilfsmittel. Sie nutzen KI noch nicht als echte Agenten.
Regeln von der Firma OpenAI
Die Firma OpenAI hat sieben wichtige Regeln aufgeschrieben. Diese Regeln helfen beim Einsatz von Agenten:
- Klare Verantwortung – Menschen müssen für Schäden haften.
- Handlungen mitschreiben – Man muss genau sehen, was der Agent tut.
- Menschliche Freigabe – Menschen müssen wichtige Dinge erlauben.
- Feste Grenzen – Der Agent darf nur bestimmte Dinge tun.
- Langsamer Start – Man führt Agenten nur Schritt für Schritt ein.
- Dinge rückgängig machen – Man muss Aktionen wieder löschen können.
- Not-Aus Schalter – Man muss den Agenten sicher stoppen können.
Zusammenarbeit von vielen Agenten
Forscher lösen ein weiteres Problem. Viele Agenten müssen zusammenarbeiten. Die Agenten tauschen dafür nicht alle Informationen aus. Sie tauschen nur kurze Signale aus. Diese Signale zeigen mögliche Veränderungen an. Das Ergebnis ist sehr gut. Die Agenten arbeiten dadurch viel besser zusammen.
TYPO3-Projekte für KI-Agenten verbessern
Ein guter Aufbau hilft nicht nur bei neuen Projekten. Sie können auch alte TYPO3-Projekte gut vorbereiten. Die KI-Agenten arbeiten dann viel besser und genauer. Wir haben dazu einen eigenen langen Text geschrieben.
Hier sind die wichtigsten Punkte:
| Hilfsmittel | Das fällt weg | Vorteil für die KI |
|---|---|---|
| Content Blocks | Verstreute Dateien | Nur noch eine Datei. Die KI liest das viel leichter. |
| PHP 8.4 Property Hooks | Lange Code-Zeilen | Viel weniger Text für jede Eigenschaft. |
| DataHandler | Direkte Datenbank-Änderungen | Arbeitsbereiche und Rechte funktionieren richtig. |
| Schema API | Komplizierte Zugriffe | Einfacher Code statt langer Suchwege. |
| Projekt-Regeln | Wissen in den Köpfen | Feste Regeln im Code helfen der KI sehr. |
| PHPStan | Menschliche Kontrolle | Automatische Kontrolle für den Code der KI. |
TYPO3 für KI fit machen
Der Kern von TYPO3 hilft der KI schon heute sehr. Sie können in Ihrem eigenen Projekt noch mehr tun. Unser Text zeigt Ihnen genau, wie das geht.
Fazit
Der richtige Aufbau für KI-Agenten ist extrem wichtig. Es ist kein leeres Modewort. Dieser Aufbau entscheidet über den Erfolg. Ohne diesen Aufbau kosten die Agenten nur viel Geld.
Im Jahr 2026 gewinnen nicht die Firmen mit den meisten Mitarbeitern. Es gewinnen die Firmen mit dem besten Aufbau für ihre KI-Agenten.
Wollen Sie Ihren eigenen Code prüfen? Möchten Sie wissen, was KI-Agenten heute noch bremst? Dann empfehlen wir eine genaue Prüfung von Ihrem Aufbau. Melden Sie sich gerne bei uns.