Prime-RL: pods de inferência de escala no meio do treinamento → descobertos automaticamente → sincronização automática → roteamento automático de roteamento automático