Die Lösung war eigentlich ziemlich einfach: Mit einem Schalter für die Absicht + einer HTTP-Anfrage kann der Agent den optimalen Weg zur Informationsbeschaffung bestimmen. Fällt nur dann auf die vollständige visuelle Browsernutzung zurück, wenn es notwendig ist. Reduziert den Tokenverbrauch um ~80%. Ein schneller Benchmark: