Bài báo mới #NeurIPS2025: chúng ta nên đánh giá các mô hình học máy như thế nào mà không có một tập dữ liệu lớn đã được gán nhãn? Chúng tôi giới thiệu Đánh Giá Mô Hình Bán Giám Sát (SSME), sử dụng dữ liệu đã gán nhãn và chưa gán nhãn để ước lượng hiệu suất! Chúng tôi nhận thấy SSME chính xác hơn nhiều so với các phương pháp tiêu chuẩn.