NOUVELLES recherches des laboratoires Meta Superintelligence. Elles utilisent un cadre d'enchères stratégiques astucieux pour améliorer les agents auto-améliorants sur des tâches complexes. De petits agents ne suffisent pas toujours. Sur les tâches les plus simples, un agent de 4 milliards de paramètres atteint 87 % des performances d'un agent de 32 milliards. Mais sur les tâches les plus complexes, cette performance relative tombe à seulement 21 %. L'hypothèse par défaut aujourd'hui est que vous utilisez soit le plus grand modèle pour tout, soit que vous dirigez les tâches avec un classificateur entraîné. Mais les routeurs entraînés se dégradent à mesure que la difficulté des tâches augmente, et les cascades non prédictives deviennent prohibitivement coûteuses pour les charges de travail agentiques. Cette nouvelle recherche introduit SALE (Enchères Stratégiques pour l'Efficacité des Charges de Travail), un cadre inspiré des marchés de freelances. Au lieu de prédire quel modèle utiliser uniquement à partir d'une description de tâche, les agents enchérissent avec de courts plans stratégiques qui sont évalués par un mécanisme systématique de coût-valeur. Comment fonctionne l'enchère ? Chaque agent candidat propose un plan de solution stratégique. Un jury de pairs évalue les plans par valeur prédite. Un prédicteur de coût heuristique estime le coût d'exécution. L'agent avec le meilleur compromis coût-valeur gagne et exécute son plan. Le mécanisme d'auto-amélioration est là où cela devient intéressant. Après chaque enchère, toutes les stratégies proposées sont stockées dans une banque de mémoire partagée. Les agents moins chers qui ont perdu peuvent apprendre des stratégies gagnantes et soumettre des enchères affinées, semblable à des freelances qui améliorent leurs compétences au fil du temps. Sur les tâches de recherche approfondie, SALE dépasse le meilleur agent unique en pass@1 de 3,5 points tout en réduisant le coût de 35 %. Sur les tâches de codage, il améliore le pass@1 de 2,7 points à un coût inférieur de 25 %. Dans les deux domaines, SALE réduit la dépendance au plus grand agent de 53 %. Les routeurs existants comme WTP et FrugalGPT sous-performent soit par rapport au plus grand agent, soit échouent à réduire les coûts. Les coûts de FrugalGPT augmentent en fait sur des tâches de codage complexes, atteignant 0,61 dollars par million de tokens contre 0,36 dollars pour le meilleur agent. Des mécanismes de coordination inspirés du marché qui organisent des agents hétérogènes en écosystèmes adaptatifs peuvent systématiquement surpasser à la fois les grands modèles uniques et les approches de routage entraînées. Article : Apprenez à construire des agents IA efficaces dans notre académie :