Nowe badania dotyczące tego, kiedy metody gradientu spektralnego (np. Muon) pomagają w uczeniu głębokim: 1. Identyfikujemy powszechny rodzaj złego uwarunkowania w DL: macierze po aktywacji mają niską stabilność rangi. 2. Następnie wyjaśniamy, dlaczego metody spektralne mogą działać dobrze pomimo tego. Długa dyskusja