Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
NUEVA investigación de Meta Superintelligence Labs.
Utiliza un marco inteligente de subastas estratégicas para mejorar a los agentes que se automejoran en tareas complejas.
Los agentes pequeños no siempre son suficientes.
En las tareas más simples, un agente de parámetros 4B alcanza el 87% del rendimiento de un agente 32B. Pero en las tareas más complejas, ese rendimiento relativo cae a solo un 21%.
La suposición por defecto hoy es que o usas el modelo más grande para todo o enrutas tareas con un clasificador entrenado.
Pero los routers entrenados se degradan a medida que aumenta la dificultad de las tareas, y las cascadas no predictivas se vuelven prohibitivamente caras para cargas de trabajo agentes.
Esta nueva investigación introduce SALE (Strategy Auctions for Workload Efficiency), un marco inspirado en los mercados de freelancers. En lugar de predecir qué modelo usar solo a partir de una descripción de la tarea, los agentes pujan con planes estratégicos breves que se califican mediante un mecanismo sistemático de coste-valor.
¿Cómo funciona la subasta? Cada agente candidato propone un plan de solución estratégica. Un jurado de pares califica los planes según el valor previsto. Un predictor de costes heurístico estima el coste de ejecución. El agente con el mejor equilibrio coste-valor gana y ejecuta su plan.
El mecanismo de superación personal es donde se pone interesante. Después de cada subasta, todas las estrategias propuestas se almacenan en una memoria compartida. Los agentes más baratos que han perdido pueden aprender de estrategias ganadoras y presentar ofertas refinadas, de forma análoga a los freelancers que mejoran sus habilidades con el tiempo.
En tareas de búsqueda profunda, SALE supera la pass@1 del mejor agente individual en 3,5 puntos, mientras reduce el coste en un 35%. En las tareas de programación, mejora pass@1 en 2,7 puntos con un coste un 25% menor. En ambos dominios, SALE reduce la dependencia del agente más grande en un 53%.
Los routers existentes como WTP y FrugalGPT o bien rinden por debajo del agente más grande o no logran reducir costes. Los costes de FrugalGPT en realidad aumentan en tareas de codificación complejas, alcanzando 0,61 dólares por millón de tokens frente a los 0,36 dólares del mejor agente.
Los mecanismos de coordinación inspirados en el mercado que organizan agentes heterogéneos en ecosistemas adaptativos pueden superar sistemáticamente tanto a modelos grandes individuales como a enfoques de enrutamiento entrenados.
Papel:
Aprende a crear agentes de IA efectivos en nuestra academia:

Populares
Ranking
Favoritas
