Nya forskningsstudier där spektralgradientmetoder (t.ex. Muon) hjälper till vid djupinlärning: 1. Vi identifierar en genomgripande form av ill-conditioning i DL: post-aktiveringsmatriser har låg-stabil rang. 2. Vi förklarar sedan varför spektrala metoder kan prestera väl trots detta. Lång tråd