Штучний інтелект отримав ступінь доктора філософії, і тепер він на ринку праці. Представляємо індекс продуктивності штучного інтелекту (APEX) – орієнтир, який вимірює, наскільки добре ми автоматизували найцінніші галузі у світі. Більшість бенчмарків вивчають абстрактні можливості. APEX оцінює ефективність моделі за реальними результатами в галузі права, фінансів, консалтингу та медицини. Моделі, найбільш здатні виконувати роботу на сьогоднішній день, за даними APEX: 🥇 ЗПТ 5 🥈 Грок 4 🥉 Gemini 2.5 Спалах Інші висновки: - GPT 5 демонструє найвищу продуктивність у всіх 4 доменах - Деякі дешевші моделі перевершують дорожчі моделі від того ж постачальника (наприклад, Gemini 2.5 Flash проти Gemini 2.5 Pro) - Найкраща модель з відкритим вихідним кодом, Qwen (7-е місце), показує лише 2% позаду Grok 4 в загальному заліку