Nový článek #NeurIPS2025: Jak bychom měli hodnotit modely strojového učení bez velké, označené datové sady? Zavádíme Semi-Supervised Model Evaluation (SSME), který k odhadu výkonu používá označená a neoznačená data! Zjistili jsme, že SSME je mnohem přesnější než standardní metody.