Nueva investigación sobre 445 puntos de referencia de IA • El 48% no está de acuerdo con lo que miden • El 39% usa datos convenientes, no correctos • 16% de significación estadística de la prueba Todavía no sabemos cómo medir nuestras herramientas más poderosas En mi opinión, trata las evaluaciones como deportes, no como el SAT Pruebas de > de competición reglas claras -> resultados comprensibles para el ser humano