CERCETĂRI NOI de la Meta Superintelligence Labs. Folosește un cadru inteligent de licitație strategică pentru a îmbunătăți agenții care se auto-îmbunătățesc în sarcini complexe. Agenții mici nu sunt întotdeauna suficienți. La cele mai simple sarcini, un agent cu parametri 4B atinge 87% din performanța unui agent 32B. Dar la cele mai complexe sarcini, performanța relativă scade la doar 21%. Presupunerea implicită astăzi este că fie folosești cel mai mare model pentru orice, fie rutezi sarcinile cu un clasificator antrenat. Dar routerele antrenate se degradează pe măsură ce dificultatea sarcinii crește, iar cascadele nepredictive devin prohibitiv de costisitoare pentru sarcini agente. Această nouă cercetare introduce SALE (Strategy Auctions for Workload Efficiency), un cadru inspirat de piețele de freelanceri. În loc să prezică ce model să folosească doar dintr-o descriere a sarcinii, agenții licitează cu planuri strategice scurte care sunt evaluate printr-un mecanism sistematic cost-valoare. Cum funcționează licitația? Fiecare agent candidat propune un plan strategic de soluție. Un juriu de egalitate evaluează planurile după valoarea prezisă. Un predictor euristic de costuri estimează costul de execuție. Agentul cu cel mai bun compromis cost-valoare câștigă și își execută planul. Mecanismul de auto-îmbunătățire devine interesant. După fiecare licitație, toate strategiile propuse sunt stocate într-o bancă de memorie partajată. Agenții mai ieftini care au pierdut pot învăța din strategii câștigătoare și pot depune oferte rafinate, analog cu freelancerii care își îmbunătățesc abilitățile în timp. La sarcinile de căutare aprofundată, SALE depășește cel mai bun pass@1 al unui singur agent cu 3,5 puncte, reducând costul cu 35%. La sarcinile de programare, îmbunătățește pass@1 cu 2,7 puncte, la un cost cu 25% mai mic. În ambele domenii, SALE reduce dependența de cel mai mare agent cu 53%. Routerele existente precum WTP și FrugalGPT fie performanță sub cel mai mare agent, fie nu reușesc să reducă costurile. Costurile FrugalGPT cresc de fapt la sarcini complexe de programare, ajungând la 0,61 dolari pe milion de tokenuri, față de 0,36 dolari pentru cel mai bun agent. Mecanismele de coordonare inspirate de piață care organizează agenți eterogeni în ecosisteme adaptive pot depăși sistematic atât modelele mari individuale, cât și abordările de rutare antrenate. Hârtie: Învață să construiești agenți AI eficienți în academia noastră: