Новая статья #NeurIPS2025: как нам оценивать модели машинного обучения без большого размеченного набора данных? Мы представляем Полу-Управляемую Оценку Моделей (SSME), которая использует размеченные и неразмеченные данные для оценки производительности! Мы обнаружили, что SSME гораздо точнее стандартных методов.