Thời gian Speedrun WR của NanoGPT đã giảm xuống dưới 90 giây, từ 92.1 xuống 89.8 nhờ 4 đóng góp gần đây: 1. Tinh chỉnh Kernels (-0.4s) từ @.EmmetBicker trên github & Hệ thống AI Aster 2. Tinh chỉnh Value Embeds (-0.4s) từ @photon_mz 3. Giao tiếp thưa cho gradient bigram (-0.3s) từ @roeeshenberg 4. Lịch trình max_seq_len và tăng min lr (-1.2s) từ @.dualverse-ai trên github & Hệ thống AI Station