Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
.@AnkythShukla kom med en dristig påstand i podkasten:
"Bedre enn utviklere, bedre enn designere, bedre enn administrerende direktør og forretningsfolk, er prosjektledere i bunn og grunn plassert i en posisjon hvor de burde eie evalueringene. De har kunnskap om virksomheten, kunden og teknologien.»
Dette er et strukturelt argument, ikke en mening. Her er hvorfor det er viktig:
> Ingeniører forstår modellen. De forstår ikke kundens definisjon av «godt resultat».
> Designere forstår opplevelsen. De forstår ikke de tekniske begrensningene ved ikke-deterministiske systemer.
> Bedriftsledere forstår avkastningen på investeringen. De forstår ikke hva en LLM-dommer er eller hvordan man kalibrerer en.
> Statsministeren sitter i krysset mellom alle tre. Det er akkurat det AI-evalueringer krever – noen som kan oversette forretningskrav til målbare evalueringskriterier, og deretter validere at AI-en faktisk oppfyller dem i produksjon.
AI-evalueringer er ikke QA-testing rebrandet. Det er en grunnleggende ny disiplin. Og prosjektledere er de naturlige eierne.
Hele episoden forklarer de nøyaktige måleparametrene, verktøyene og LLM-vurderingsrammeverkene steg for steg.
Topp
Rangering
Favoritter
