Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI memiliki gelar PhD dan sekarang berada di pasar kerja.
Memperkenalkan Indeks Produktivitas AI (APEX), tolok ukur yang mengukur seberapa baik kami mengotomatiskan industri paling berharga di dunia.
Sebagian besar tolok ukur mempelajari kemampuan abstrak. APEX mengevaluasi kinerja model pada hasil nyata di seluruh hukum, keuangan, konsultasi, dan kedokteran.
Model yang paling mampu melakukan pekerjaan saat ini, menurut APEX:
🥇 GPT 5
🥈 Grok 4
🥉 Gemini 2.5 Flash
Temuan lainnya:
- GPT 5 menunjukkan performa terkuat di semua 4 domain
- Beberapa model yang lebih murah mengungguli model yang lebih mahal dari penyedia yang sama (misalnya Gemini 2.5 Flash vs. Gemini 2.5 Pro)
- Model open source terbaik, Qwen (ke-7), hanya berkinerja 2% di belakang Grok 4 secara keseluruhan
Teratas
Peringkat
Favorit

