Novo recorde de Speedrun do NanoGPT em 113.7 (-1.4s) de @ChrisJMcCormick, com banco de parâmetros para centralizar certos parâmetros por camada, Adam otimizado, aumento da precisão do buffer ema e matrizes de porta de Muon para Adam. Cientistas afirmam que os recordes devem parar após atingir 0s.