ajouté des speedruns de style nanogpt à nmoe ainsi que le support H100 (bf16 uniquement). Je publierai dès que je pourrai comprendre ce qui se passe ici