O nosso agente Aleph, alimentado pelo GPT‑5.2 da @OpenAI, obteve 668/672, 99,4% com hiper-eficiência no PutnamBench de @gtsoukal et al. (o benchmark formal de matemática mais difícil), um passo crítico na geração automática de código em linguagem natural — inglês como programação — com resultados sem alucinações.