より多くの事前訓練は、閉ループロールアウトを用いたブラインドA/B評価を通じてGEN-0の実ロボット性能を向上させます。 低データ環境では改善は顕著ですが、最良のモデルは事前訓練と十分なトレーニング後学習の両方で成功を収めます。 ブログの追記をご覧ください: