PRIME-RL: Škálovací inferenční moduly během tréninku → automaticky objevují → váhy automaticky synchronizují → rollouty automaticky směrují