.@NVIDIA baru saja melakukan sengatan luar biasa menggunakan model 4B kecil yang mengalahkan sistem yang jauh lebih besar pada ARC AGI 2, 29,72% / $0.20 per tugas! Dengan bersandar pada data sintetis dan pelatihan waktu pengujian alih-alih skala brute-force, tim NVARC membuktikan bahwa desain yang cerdas dapat melampaui jumlah parameter mentah. Ini adalah sinyal yang menarik bahwa penalaran yang efisien dan adaptif mungkin menjadi perbatasan nyata dalam kemajuan AGI - bukan hanya model yang semakin besar. • Akurasi 29,72% pada papan peringkat resmi ARC-AGI-2 • Menggunakan model parameter 4B yang mengalahkan model yang jauh lebih besar dan lebih mahal pada tolok ukur yang sama. • Biaya inferensi hanya $0,20 per tugas, diaktifkan oleh data sintetis, pelatihan waktu pengujian, dan alat NVIDIA NeMo.
@nvidia Edit: maaf skornya 27,64%, saya membuat kesalahan. Tapi tetap luar biasa mengesankan
38,08K