$A^3$-Bench Un nuovo benchmark che valuta i meccanismi guidati dalla memoria nel ragionamento scientifico. Misura come i modelli attivano gli "ancoraggi" (formule fondamentali) e gli "attrattori" (schemi/esempi) durante l'inferenza, andando oltre il semplice controllo delle risposte finali.