Nuestro agente Aleph, impulsado por GPT‑5.2 de @OpenAI, obtuvo 668/672, 99.4% con hiper-eficiencia en el PutnamBench de @gtsoukal et al. (el benchmark formal de matemáticas más difícil), un paso crítico en la generación automática de código en lenguaje natural — el inglés como programación — con resultados sin alucinaciones.