Uusi #NeurIPS2025 paperi: miten meidän pitäisi arvioida koneoppimismalleja ilman suurta, merkittyä tietojoukkoa? Esittelemme Semi-Supervised Model Evaluation (SSME) -arvioinnin, joka käyttää merkittyjä ja merkitsemättömiä tietoja suorituskyvyn arvioimiseen! Huomaamme, että SSME on paljon tarkempi kuin standardimenetelmät.