Не дайте открытой версии @NousResearch пройти мимо вас. NousCoder-14B — это модель для соревновательного программирования, которая увеличила результат на 7% на LiveCodeBench и была обучена всего за 4 дня. Открытый RL для кодирования только что значительно улучшился.