Un progetto che sono molto felice di vedere rilasciato, guidato da @couplefire12 durante il suo tirocinio presso Together 🔥 Se sei curioso di conoscere il ragionamento con RL in contesti non verificabili, dai un'occhiata!