Tam toplu gradyanlarda bile, DL optimize ediciler, *kararlılığın sınırında* çalıştıkları için klasik optimizasyon teorisine meydan okurlar. @alex_damian_ ile "merkezi akışları" tanıtıyoruz: gerçek NN'ler üzerinde doğru nicel tahminler yapan bu dinamikleri analiz etmek için teorik bir araç.