Novo artigo #NeurIPS2025: como devemos avaliar modelos de aprendizado de máquina sem um grande conjunto de dados rotulado? Apresentamos a Avaliação de Modelo Semi-Supervisionada (SSME), que usa dados rotulados e não rotulados para estimar o desempenho! Descobrimos que o SSME é muito mais preciso do que os métodos padrão.