Github'da @.andrewbriand ve @.jrauvola'dan 106.9 (-2.3s) frekansında yeni NanoGPT Speedrun WR var. Torch derleyicinin Relu(x)^2 aktivasyonu için verimsiz ayrı bir çekirdek çalıştırdığını gözlemlediler ve aktivasyonu önceki lineer operasyona entegre etmek için bir triton çekirdeği eklediler.