🚀Představujeme naši novou práci: Zákon škálování konfigurace na výkon pomocí Neural Ansatz. Jazykový model trénovaný na rozsáhlých předtrénovacích logech dokáže přesně předpovědět, jak tréninkové konfigurace ovlivňují výkon předtrénování, a zobecnit na běhy s 10x vyšší výpočetní kapacitou.