Interesujące, jak nikt nie rozumie, że pipeline RL jest najtrudniejszą częścią budowania modelu sota w dzisiejszych czasach (przynajmniej przy rozmiarze poniżej 1T parametrów)