Eine Analyse aus unserem Vorab-Audit von Opus 4.5 sticht mir ins Auge. Unsere Verhaltensbewertungen haben ein Beispiel für offensichtliche Täuschung durch das Modell aufgedeckt. Durch die Analyse der internen Aktivierungen haben wir eine vermutete Ursache identifiziert und Fälle ähnlichen Verhaltens während des Trainings festgestellt. (1/7)