Việc huấn luyện trước nhiều hơn cải thiện hiệu suất của robot thực GEN-0 (thông qua các đánh giá A/B mù với các vòng lặp khép kín). Các cải tiến là đáng kể trong chế độ dữ liệu thấp, nhưng các mô hình tốt nhất phát triển mạnh với cả huấn luyện trước và huấn luyện sau phong phú. Xem bổ sung trên blog: