Zajímavé je, že nikdo nechápe, že RL pipeline je dnes nejtěžší částí tvorby SOTA modelu (alespoň pod 1T parametru).