Mer förträning förbättrar GEN-0:s prestanda för verkliga robotar (via blinda A/B-utvärderingar med slutna slingor). Förbättringar är betydande i lågdata-regimen, men de bästa modellerna frodas både med förträning och riklig efterträning. Se bloggtillägg: