NUOVE ricerche dai Meta Superintelligence Labs. Utilizza un ingegnoso framework di asta strategica per migliorare gli agenti auto-miglioranti su compiti complessi. Agenti piccoli non sono sempre sufficienti. Nei compiti più semplici, un agente con 4 miliardi di parametri raggiunge l'87% delle prestazioni di un agente con 32 miliardi di parametri. Ma nei compiti più complessi, quella prestazione relativa scende solo al 21%. L'assunzione predefinita oggi è che si utilizzi il modello più grande per tutto o si instradino i compiti con un classificatore addestrato. Ma i router addestrati degradano man mano che aumenta la difficoltà del compito, e le cascades non predittive diventano proibitivamente costose per i carichi di lavoro agentici. Questa nuova ricerca introduce SALE (Aste Strategiche per l'Efficienza del Carico di Lavoro), un framework ispirato ai mercati dei freelance. Invece di prevedere quale modello utilizzare solo da una descrizione del compito, gli agenti fanno offerte con brevi piani strategici che vengono valutati da un meccanismo sistematico di costo-valore. Come funziona l'asta? Ogni agente candidato propone un piano di soluzione strategica. Una giuria di pari valuta i piani in base al valore previsto. Un predittore di costo euristico stima il costo di esecuzione. L'agente con il miglior rapporto costo-valore vince ed esegue il suo piano. Il meccanismo di auto-miglioramento è dove diventa interessante. Dopo ogni asta, tutte le strategie proposte vengono memorizzate in una banca dati condivisa. Agenti più economici che hanno perso possono apprendere dalle strategie vincenti e presentare offerte raffinate, analogo a come i freelance migliorano le proprie competenze nel tempo. Nei compiti di ricerca profonda, SALE supera il miglior agente singolo di 3,5 punti in pass@1 riducendo al contempo il costo del 35%. Nei compiti di codifica, migliora il pass@1 di 2,7 punti a un costo inferiore del 25%. In entrambi i domini, SALE riduce la dipendenza dall'agente più grande del 53%. I router esistenti come WTP e FrugalGPT o sottoperformano rispetto all'agente più grande o non riescono a ridurre i costi. I costi di FrugalGPT aumentano effettivamente nei compiti di codifica complessi, raggiungendo 0,61 dollari per milione di token rispetto ai 0,36 dollari del miglior agente. Meccanismi di coordinamento ispirati al mercato che organizzano agenti eterogenei in ecosistemi adattivi possono sistematicamente superare sia i singoli modelli grandi che gli approcci di routing addestrati. Documento: Impara a costruire agenti AI efficaci nella nostra accademia: