.@AnkythShukla kom med en dristig påstand i podkasten: "Bedre enn utviklere, bedre enn designere, bedre enn administrerende direktør og forretningsfolk, er prosjektledere i bunn og grunn plassert i en posisjon hvor de burde eie evalueringene. De har kunnskap om virksomheten, kunden og teknologien.» Dette er et strukturelt argument, ikke en mening. Her er hvorfor det er viktig: > Ingeniører forstår modellen. De forstår ikke kundens definisjon av «godt resultat». > Designere forstår opplevelsen. De forstår ikke de tekniske begrensningene ved ikke-deterministiske systemer. > Bedriftsledere forstår avkastningen på investeringen. De forstår ikke hva en LLM-dommer er eller hvordan man kalibrerer en. > Statsministeren sitter i krysset mellom alle tre. Det er akkurat det AI-evalueringer krever – noen som kan oversette forretningskrav til målbare evalueringskriterier, og deretter validere at AI-en faktisk oppfyller dem i produksjon. AI-evalueringer er ikke QA-testing rebrandet. Det er en grunnleggende ny disiplin. Og prosjektledere er de naturlige eierne. Hele episoden forklarer de nøyaktige måleparametrene, verktøyene og LLM-vurderingsrammeverkene steg for steg.