能够在“紧缩”预算下训练一个1T参数模型的真正胜利并不是节省成本。 而是效率的提升,让你能够更快地行动并提高迭代速度。注意斜率。 从我记事起,最好的深度学习模型来自于迭代速度最快的实验室。