Probando la robustez de las puntuaciones de @Havelock_AI al llevar a cabo un torneo, en el que Claude solo se presenta con los marcadores gramaticales y léxicos (sin contenido) de dos textos y se le pide que adivine cuál es más oral. Veremos si los textos con puntuaciones más altas realmente tienen ELOs más altos.
Primera prueba de lote antes de la gran carrera
89