NY forskning fra Meta Superintelligence Labs. Den bruker et smart strategi-auksjonsrammeverk for å forbedre selvforbedrende agenter på komplekse oppgaver. Små agenter er ikke alltid nok. På de enkleste oppgavene oppnår en 4B-parameteragent 87 % av ytelsen til en 32B-agent. Men på de mest komplekse oppgavene faller den relative ytelsen til bare 21 %. Standardantakelsen i dag er at du enten bruker den største modellen for alt, eller ruter oppgaver med en trent klassifiserer. Men trente rutere forringes etter hvert som oppgavens vanskelighetsgrad øker, og ikke-prediktive kaskader blir uoverkommelig dyre for agentiske arbeidsbelastninger. Denne nye forskningen introduserer SALE (Strategy Auctions for Workload Efficiency), et rammeverk inspirert av frilansmarkedsplasser. I stedet for å forutsi hvilken modell som skal brukes kun ut fra en oppgavebeskrivelse, byr agentene med korte strategiske planer som scores av en systematisk kostnads-verdi-mekanisme. Hvordan fungerer auksjonen? Hver kandidatagent foreslår en strategisk løsningsplan. En jevnaldrende jury vurderer planer etter forventet verdi. En heuristisk kostnadsprediktor estimerer utførelseskostnaden. Agenten med best kost-verdi-avveining vinner og gjennomfører sin plan. Selvforbedringsmekanismen er der det blir interessant. Etter hver auksjon lagres alle foreslåtte strategier i en delt minnebank. Billigere agenter som tapte kan lære av vinnende strategier og sende inn raffinerte bud, tilsvarende frilansere som utvikler kompetansen over tid. På dype søkoppgaver overgår SALE den beste enkeltagentens pass@1 med 3,5 poeng, samtidig som kostnaden reduseres med 35 %. På kodingsoppgaver forbedrer det pass@1 med 2,7 poeng til 25 % lavere kostnad. På tvers av begge domener reduserer SALE avhengigheten av den største agenten med 53 %. Eksisterende rutere som WTP og FrugalGPT presterer enten dårligere enn den største agenten eller klarer ikke å redusere kostnadene. FrugalGPTs kostnader øker faktisk på komplekse kodeoppgaver, og når 0,61 dollar per million tokens mot den beste agentens 0,36 dollar. Markedsinspirerte koordineringsmekanismer som organiserer heterogene agenter i adaptive økosystemer, kan systematisk overgå både enkeltmodeller og trente rutingsmetoder. Artikkel: Lær å bygge effektive AI-agenter i vår akademi: