Prime-RL: Podurile de inferență pe scară în timpul antrenamentului → descoperite automat → sincronizarea automată a greutății → rutarea automată