15 błędów formalnych w PutnamBench (około 2% benchmarku) zostało naprawionych, dzięki Logical Intelligence za wniesienie zmian, które zostały zidentyfikowane przez ich system Aleph Prover (jak się okazuje, obecnie również najsilniejsze podejście na liście PB)!