🚀Presentiamo il nostro nuovo lavoro: Legge di Scaling dalla Configurazione alle Prestazioni con Ansatz Neurale. Un modello linguistico addestrato su log di pre-addestramento su larga scala può prevedere con precisione come le configurazioni di addestramento influenzano le prestazioni di pre-addestramento e generalizzare a esecuzioni con 10 volte più potenza di calcolo.