Yeni makaleler, spektral gradyan yöntemlerinin (örneğin Muon) derin öğrenmeye yardımcı olduğunu inceliyor: 1. DL'de yaygın bir kötü koşullandırma biçimi tespit ediyoruz: aktivasyon sonrası matrisler düşük-stabil derecededir. 2. Sonra spektral yöntemlerin buna rağmen neden iyi performans gösterebileceğini açıklıyoruz. Uzun iplik