Der NanoGPT Speedrun WR ist unter 90s gefallen und von 92,1 auf 89,8 gesunken, dank 4 kürzlicher Beiträge: 1. Abgestimmte Kerne (-0,4s) von @.EmmetBicker auf github & AI System Aster 2. Abgestimmte Wert-Embeds (-0,4s) von @photon_mz 3. Sparse Kommunikation für Bigramm-Gradienten (-0,3s) von @roeeshenberg 4. max_seq_len Zeitplan und erhöhte min lr (-1,2s) von @.dualverse-ai auf github & AI System Station