查看我們最新的研究,由 @rohin_manvi 主導,關於自適應測試時間計算。 大型語言模型(LLMs)可以被訓練來預測它們自己的未來,了解它們的表現有多好以及需要多長時間。 這種機制可以作為一種新的抽樣策略,用於提高測試時間計算的效率。