NanoGPT Speedrun WR har brutt under 90-tallet, og falt fra 92,1 til 89,8 fra 4 nylige bidrag: 1. Tunede kjerner (-0,4s) fra @. EmmetBicker på github og AI System Aster 2. Tuned value Embeds (-0,4 s) fra @photon_mz 3. Sparsomme kommunikasjoner for bigramgradienter (-0,3 s) fra @roeeshenberg 4. max_seq_len tidsplan og økt minimumsfrekvens (-1,2 sekunder) fra @.dualverse-ai på github og AI System Station