Большее количество предварительного обучения улучшает производительность реального робота GEN-0 (через слепые A/B оценки с замкнутыми петлями). Улучшения значительны в условиях нехватки данных, но лучшие модели достигают успеха как с предварительным обучением, так и с достаточным постобучением. Смотрите дополнение к блогу: