Nuevo WR NanoGPT Speedrun a 113,7 (-1,4s) de @ChrisJMcCormick, con banco de parámeas para centralizar ciertos parámetros por capa, Adam optimizado, aumento de precisión en el búfer EMA y matrices de puertas de Muón a Adam. Los científicos afirman que los récords deben detenerse tras alcanzar los 0.