No he leído el artículo completo, que aún no ha salido, así que no puedo dar detalles, pero me alegra ver que se aplica más rigor metodológico al LLM como juez. Las calificaciones LLM están en el centro de un gran número de referencias y a menudo se utilizan sin una validación estadística clara.