Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Bidang AI membutuhkan tolok ukur yang lebih keras untuk menguji kemampuan model AI terbaru. Pembaruan @Kaggle Game Arena dengan manusia serigala dan poker (heads-up) ditambah catur, memberi kita ukuran objektif baru dari keterampilan dunia nyata seperti perencanaan dan pengambilan keputusan di bawah ketidakpastian.

30 Jan 2026
📌 Tandai Kalender Anda: Acara Arena Game Langsung Senin ini!
Kami merilis dua permainan baru, Poker dan Werewolf, bersama dengan papan peringkat Catur yang diperbarui Senin depan, 2 Februari, berlangsung setiap hari dari pukul 9:30 PT hingga 11:30 PT hingga 4 Februari.
Tidak seperti tolok ukur gaya Q&A standar yang akhirnya jenuh, tes ini secara otomatis menjadi lebih sulit seiring dengan semakin baik modelnya. Bagus memiliki cara yang dapat diverifikasi untuk mengukur kemajuan menuju AGI. Tujuannya adalah untuk menambahkan 100-an game yang mencakup banyak aspek kecerdasan, dengan papan peringkat keseluruhan
Juga keren melihat model Gemini 3 terbaru kami di puncak papan peringkat catur - peningkatan yang sangat cepat dari saat benchmark pertama kali diluncurkan! Perhatikan semua model masih hanya bermain pada tingkat amatir yang lemah sehingga banyak peningkatan yang diperlukan.

36
Teratas
Peringkat
Favorit
