esto siempre ha estado mal - pero ahora es categóricamente incorrecto en la era de RL en dominios verificables los modelos buscan la verdad e incluso interactúan con un mundo exterior duro a través del uso de herramientas