新的 #NeurIPS2025 論文:我們應該如何在沒有大型標記數據集的情況下評估機器學習模型?我們介紹了半監督模型評估(SSME),它使用標記和未標記數據來估計性能!我們發現 SSME 的準確性遠高於標準方法。