Interesant cum nimeni nu înțelege că pipeline-ul RL este cea mai dificilă parte a construirii unui model SOTA în zilele noastre (cel puțin sub dimensiunea de 1T param).