Un análisis de nuestra auditoría previa al lanzamiento de Opus 4.5 me llama la atención. Nuestras evaluaciones conductuales descubrieron un ejemplo de aparente engaño por parte del modelo. Analizando las activaciones internas, identificamos una causa raíz sospechosa y casos de comportamiento similar durante el entrenamiento. (1/7)