Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
NUEVA investigación de Meta Superintelligence Labs.
Utiliza un ingenioso marco de subastas estratégicas para mejorar agentes auto-mejoradores en tareas complejas.
Los agentes pequeños no siempre son suficientes.
En las tareas más simples, un agente de 4B de parámetros alcanza el 87% del rendimiento de un agente de 32B. Pero en las tareas más complejas, ese rendimiento relativo cae al 21%.
La suposición predeterminada hoy en día es que o bien usas el modelo más grande para todo o enrutas tareas con un clasificador entrenado.
Pero los enrutadores entrenados se degradan a medida que aumenta la dificultad de la tarea, y las cascadas no predictivas se vuelven prohibitivamente costosas para las cargas de trabajo agénticas.
Esta nueva investigación introduce SALE (Subastas Estratégicas para la Eficiencia de Carga de Trabajo), un marco inspirado en los mercados de freelancers. En lugar de predecir qué modelo usar solo a partir de una descripción de tarea, los agentes pujan con planes estratégicos cortos que son evaluados por un mecanismo sistemático de costo-valor.
¿Cómo funciona la subasta? Cada agente candidato propone un plan de solución estratégica. Un jurado de pares puntúa los planes según el valor previsto. Un predictor de costo heurístico estima el costo de ejecución. El agente con la mejor relación costo-valor gana y ejecuta su plan.
El mecanismo de auto-mejora es donde se pone interesante. Después de cada subasta, todas las estrategias propuestas se almacenan en un banco de memoria compartida. Los agentes más baratos que perdieron pueden aprender de las estrategias ganadoras y presentar pujas refinadas, análogas a los freelancers que mejoran sus habilidades con el tiempo.
En tareas de búsqueda profunda, SALE supera el pass@1 del mejor agente único en 3.5 puntos mientras reduce el costo en un 35%. En tareas de codificación, mejora el pass@1 en 2.7 puntos a un costo 25% menor. En ambos dominios, SALE reduce la dependencia del agente más grande en un 53%.
Los enrutadores existentes como WTP y FrugalGPT o bien rinden por debajo del agente más grande o no logran reducir costos. Los costos de FrugalGPT en realidad aumentan en tareas de codificación complejas, alcanzando 0.61 dólares por millón de tokens frente a los 0.36 dólares del mejor agente.
Los mecanismos de coordinación inspirados en el mercado que organizan agentes heterogéneos en ecosistemas adaptativos pueden superar sistemáticamente tanto a modelos grandes únicos como a enfoques de enrutamiento entrenados.
Artículo:
Aprende a construir agentes de IA efectivos en nuestra academia:

Parte superior
Clasificación
Favoritos
