Sie schulen Menschen bei OpenAI, Anthropic, Google und Meta in Bezug auf KI-Evaluierungen (@HamelHusain und @sh_reya). Hier ist ihr vollständiger Prozess: 8:27 - Warum jeder Evaluierungen benötigt 15:43 - Fehleranalyseprozess 32:18 - LLM-Richter 44:52 - Metriken