Prime-RL:トレーニング中の推論ポッド→自動発見→体重、自動同期、→ロールアウト、自動ルート