Ziemlich cool, OpenProse + Claude kochen seit über 28 Minuten. Hunderte von Werkzeugnutzungen, viele parallele Agenten. Der Schlüssel für lang laufende Agenten sind Red Team / Blue Team. 2 Agenten überprüfen die Arbeit eines beliebigen Agenten, und dann geht ein zufälliges Red Team herum und führt eine adversarielle Überprüfung durch (die Kunst liegt darin, dies richtig einzurichten). Sicherheitsüberprüfung kritischer Teile des Systems (auch Kunst, dies einzurichten). Der Code-Qualitätsagent wird ständig durchgesetzt.