prime-rl:缩放推理节点中训练 → 自动发现 → 权重自动同步 → 回合自动路由