查看我们最新的研究,由@rohin_manvi主导,关于自适应测试时计算。 大型语言模型(LLMs)可以被训练来预测它们自己的未来,预测它们的表现有多好以及需要多长时间。 这个机制可以作为一种新的采样策略,用于提高测试时计算的效率。