Forman a personas en OpenAI, Anthropic, Google y Meta en evaluaciones de IA (@HamelHusain y @sh_reya). Aquí está su proceso completo: 8:27 - Por qué todo el mundo necesita evaluaciones 15:43 - Proceso de análisis de errores 32:18 - Jueces de LLM 44:52 - Métricas