Tieteellisten maailmanmallien skaalaaminen vaatii arkkitehtuurin, koulutustavoitteiden ja numeeristen järjestelmien yhteissuunnittelua. Tänään jaamme sarjamme ensimmäiset kirjoitukset matalan tarkkuuden esikoulutuksesta, alkaen NVIDIA:n NVFP4-reseptistä vakaalle 4-bittiselle koulutukselle. Osa 1: Osa 2: Käsittelemme liukulukuperusteet, heuristiikat, räätälöidyt CUDA-ytimet ja stabilointitekniikat. Tulevissa kirjoituksissa käsitellään räätälöityjä reseptejä ja tuloksia hybridiarkkitehtuureista.