AI hat seinen Doktortitel und ist jetzt auf dem Arbeitsmarkt. Wir stellen den AI Productivity Index (APEX) vor, einen Maßstab, der misst, wie gut wir die wertvollsten Branchen der Welt automatisiert haben. Die meisten Benchmarks untersuchen abstrakte Fähigkeiten. APEX bewertet die Modellleistung bei realen Ergebnissen in den Bereichen Recht, Finanzen, Beratung und Medizin. Die Modelle, die heute am besten in der Lage sind, Arbeit zu leisten, laut APEX: 🥇 GPT 5 🥈 Grok 4 🥉 Gemini 2.5 Flash Weitere Erkenntnisse: - GPT 5 zeigt die stärkste Leistung in allen 4 Bereichen - Einige günstigere Modelle übertreffen teurere Modelle desselben Anbieters (z. B. Gemini 2.5 Flash vs. Gemini 2.5 Pro) - Das beste Open-Source-Modell, Qwen (7.), liegt insgesamt nur 2 % hinter Grok 4.