это круто. Я предсказываю, что к маю 2026 года любой сможет обучить пользовательскую модель, подобную этой, для ~любой задачи с помощью некоторой комбинации prime-rl/verifiers, tinker, skyRL, slime и т.д. защитой будет знание, какую задачу нужно решать с помощью RL и волшебство данных/окружения.