Nos últimos 6 meses, a perda do Speedrun do NanoGPT para 3,28 no FineWeb caiu 33%, ficando em 2 minutos. Recentemente, um subconjunto dessas mudanças foi copiado em massa para a faixa de perdas em escala maior de 2,92. Surpreendentemente, a corrida yolo desafinada quebrou o recorde de 2,92 derrotas em 25%.