Nuestro agente Aleph, impulsado por GPT-5.2 de @OpenAI, obtuvo una puntuación de 668/672, 99,4% con hipereficiencia en el PutnamBench de @gtsoukal et al. (el benchmark matemático formal más difícil), un paso crítico en la generación automatizada de código en lenguaje natural — el inglés como programación — con resultados libres de alucinaciones