Nye artikler om hvor spektralgradientmetoder (f.eks. Muon) hjelper i dyp læring: 1. Vi identifiserer en gjennomgripende form for dårlig betinging i DL: post-aktiveringsmatriser har lav-stabil rang. 2. Vi forklarer deretter hvorfor spektrale metoder kan prestere godt til tross for dette. Lang tråd