Papel chulo de Meta. Y otra excelente aplicación de sistemas multiagente. (lo marca) Entrenar modelos modernos de IA requiere enormes cantidades de datos de alta calidad. Sin embargo, el cuello de botella no es solo la cantidad. Los datos simplemente no son lo suficientemente diversos. Los modelos individuales que generan datos sintéticos tienden a producir resultados homogéneos, patrones repetitivos y carecen de la variedad matizada que se encuentra en los conjuntos de datos creados por humanos. Esta nueva investigación de Meta presenta Matrix, un marco peer-to-peer donde múltiples agentes de IA generan de forma colaborativa datos sintéticos de entrenamiento mediante interacciones descentralizadas. Matrix logra un rendimiento de generación de datos del 2 al 15× mayor bajo recursos de hardware idénticos, sin comprometer la calidad de la salida. TL; DR: En lugar de que un modelo produzca datos, los agentes especializados desempeñan roles distintos e interactúan entre sí. Uno hace preguntas, otro responde, un tercero evalúa la calidad. Estas conversaciones de varios turnos capturan razonamientos complejos y perspectivas diversas. Lo que hace diferente a Matrix: no hay coordinador central. Los agentes se comunican directamente en una arquitectura totalmente descentralizada. Esto permite escalabilidad sin cuellos de botella en la infraestructura. El marco opera mediante protocolos de conversación basados en roles, patrones de interacción de múltiples turnos y filtrado de calidad integrado en cada etapa. Solo los datos que cumplen los umbrales de calidad entran en el conjunto de entrenamiento final. La colaboración multiagente produce datos sintéticos más diversos que los enfoques de modelo único. Los conjuntos de datos resultantes mejoran el rendimiento del modelo a nivel posterior a través de benchmarks de razonamiento y seguimiento de instrucciones.