Більше попереднього навчання покращує продуктивність GEN-0 для справжніх роботів (через сліпі оцінювання A/B з замкненим циклом запуску). Покращення мають значне значення в режимі низьких даних, але найкращі моделі процвітають як при попередньому навчанні, так і при достатній післятренуванні. Дивіться додаток до блогу: