Notre agent Aleph, propulsé par GPT‑5.2 d'@OpenAI, a obtenu un score de 668/672, 99,4 % avec une hyper-efficacité sur le PutnamBench de @gtsoukal et al. (le benchmark mathématique formel le plus difficile), une étape critique dans la génération automatique de code en langage naturel — l'anglais comme programmation — avec des résultats sans hallucination.