Mais pré-treinamento melhora o desempenho do robô real GEN-0 (por meio de avaliações A/B cegas com lançamentos em loop fechado). As melhorias são significativas no regime de poucos dados, mas os melhores modelos prosperam tanto com pré-treinamento quanto com pós-treinamento amplo. Veja o adendo do blog: