AI har sin doktorgrad og nå er den på arbeidsmarkedet. Vi introduserer AI Productivity Index (APEX), en målestokk som måler hvor godt vi har automatisert de mest verdifulle bransjene i verden. De fleste benchmarks studerer abstrakte evner. APEX evaluerer modellytelse på reelle leveranser på tvers av juss, finans, rådgivning og medisin. Modellene som er mest i stand til å utføre arbeid i dag, ifølge APEX: 🥇 GPT 5 🥈 Grok 4 🥉 Gemini 2.5 blits Andre funn: - GPT 5 viser den sterkeste ytelsen på tvers av alle 4 domener - Noen billigere modeller overgår dyrere modeller fra samme leverandør (f.eks. - Den beste åpen kildekode-modellen, Qwen (7.), presterer bare 2 % bak Grok 4 totalt sett