Vill du skapa skalningslagar för RL men är osäker på hur du skalar? Eller vilken skala? Eller skulle RL till och med skala förutsägbart? Vi introducerar: Konsten att skala Reinforcement Learning Compute för LLM