15 falhas de formalização no PutnamBench (cerca de 2% do benchmark) foram corrigidas, graças à Logical Intelligence por contribuir com as mudanças, que foram identificadas pelo sistema Aleph Prover (que, por acaso, também é atualmente a abordagem mais forte no ranking do PB)!