Nowy artykuł #NeurIPS2025: jak powinniśmy oceniać modele uczenia maszynowego bez dużego, oznaczonego zbioru danych? Wprowadzamy Semi-Supervised Model Evaluation (SSME), które wykorzystuje dane oznaczone i nieoznaczone do oszacowania wydajności! Odkrywamy, że SSME jest znacznie dokładniejsze niż standardowe metody.