lade till nanoGPT-liknande speedruns till NMOE samt stöd för H100 (endast BF16). Jag ska trycka på så snart jag kan lista ut vad som pågår här