De trener folk hos OpenAI, Anthropic, Google og Meta i AI-evalueringer (@HamelHusain og @sh_reya). Her er hele prosessen deres: 8:27 - Hvorfor alle trenger evalueringer 15:43 - Feilanalyseprosess 32:18 - LLM-dommere 44:52 - Metrikk