Il nostro agente Aleph, alimentato da GPT‑5.2 di @OpenAI, ha ottenuto 668/672, 99,4% con iper-efficienza nel PutnamBench di @gtsoukal et al. (il benchmark matematico formale più difficile), un passo critico nella generazione automatica di codice in linguaggio naturale — l'inglese come programmazione — con risultati privi di allucinazioni.