$A^3$-Bench Ein neuer Benchmark, der speichergetriebene Mechanismen im wissenschaftlichen Denken bewertet. Er misst, wie Modelle "Anker" (Kernformeln) und "Attraktoren" (Schemas/Beispiele) während der Inferenz aktivieren – und geht über die bloße Überprüfung der Endergebnisse hinaus.