Nouvel article #NeurIPS2025 : comment devrions-nous évaluer les modèles d'apprentissage automatique sans un grand ensemble de données étiquetées ? Nous introduisons l'Évaluation de Modèle Semi-Supervisée (SSME), qui utilise des données étiquetées et non étiquetées pour estimer la performance ! Nous constatons que SSME est de loin plus précis que les méthodes standard.