NEUE Forschung von den Meta Superintelligence Labs. Es verwendet ein cleveres Strategie-Auktions-Framework, um selbstverbessernde Agenten bei komplexen Aufgaben zu optimieren. Kleine Agenten sind nicht immer ausreichend. Bei den einfachsten Aufgaben erreicht ein 4B-Parameter-Agent 87 % der Leistung eines 32B-Agenten. Aber bei den komplexesten Aufgaben sinkt diese relative Leistung auf nur 21 %. Die Standardannahme heute ist, dass man entweder das größte Modell für alles verwendet oder Aufgaben mit einem trainierten Klassifikator zuweist. Aber trainierte Router verschlechtern sich, wenn die Aufgabenschwierigkeit zunimmt, und nicht-prädiktive Kaskaden werden für agentische Arbeitslasten prohibitively teuer. Diese neue Forschung führt SALE (Strategie-Auktionen für Arbeitslast-Effizienz) ein, ein Framework, das von Freelancer-Marktplätzen inspiriert ist. Anstatt vorherzusagen, welches Modell allein aus einer Aufgabenbeschreibung verwendet werden soll, bieten Agenten mit kurzen strategischen Plänen, die durch einen systematischen Kosten-Nutzen-Mechanismus bewertet werden. Wie funktioniert die Auktion? Jeder Kandidatenagent schlägt einen strategischen Lösungsplan vor. Eine Peer-Jury bewertet die Pläne nach vorhergesagtem Wert. Ein heuristischer Kostenprädiktor schätzt die Ausführungskosten. Der Agent mit dem besten Kosten-Nutzen-Verhältnis gewinnt und führt seinen Plan aus. Der Selbstverbesserungsmechanismus ist der interessante Teil. Nach jeder Auktion werden alle vorgeschlagenen Strategien in einer gemeinsamen Gedächtnisbank gespeichert. Günstigere Agenten, die verloren haben, können von den gewinnenden Strategien lernen und verfeinerte Gebote abgeben, ähnlich wie Freelancer im Laufe der Zeit ihre Fähigkeiten verbessern. Bei tiefen Suchaufgaben übertrifft SALE die beste Einzelagenten-Pass@1 um 3,5 Punkte, während die Kosten um 35 % gesenkt werden. Bei Programmieraufgaben verbessert es Pass@1 um 2,7 Punkte bei 25 % niedrigeren Kosten. In beiden Bereichen reduziert SALE die Abhängigkeit vom größten Agenten um 53 %. Bestehende Router wie WTP und FrugalGPT schneiden entweder schlechter ab als der größte Agent oder schaffen es nicht, die Kosten zu senken. Die Kosten von FrugalGPT steigen tatsächlich bei komplexen Programmieraufgaben und erreichen 0,61 Dollar pro Million Tokens im Vergleich zu 0,36 Dollar des besten Agenten. Markt-inspirierte Koordinationsmechanismen, die heterogene Agenten in adaptive Ökosysteme organisieren, können systematisch sowohl einzelne große Modelle als auch trainierte Routing-Ansätze übertreffen. Papier: Lernen Sie, effektive KI-Agenten in unserer Akademie zu bauen: