Los investigadores de Google encontraron que los modelos de razonamiento avanzados logran una inteligencia superior al simular espontáneamente interacciones internas, similares a las de múltiples agentes, en lugar de depender únicamente de un cálculo más largo o de un aumento de escala. Estos modelos desarrollan una "estructura social" interna donde diversas personas simuladas debaten y concilian ideas para resolver problemas complejos.
"encontramos que modelos de razonamiento como DeepSeek-R1 y QwQ-32B exhiben una diversidad de perspectivas mucho mayor que los modelos base y los modelos simplemente ajustados por instrucciones"
100