Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Berikut adalah versi yang lebih panjang dari karya Nature kami.
Argumen kami sederhana: perkiraan statistik tidak sama dengan kecerdasan.
Skor tolok ukur yang kuat sering kali mengatakan sangat sedikit tentang bagaimana LLM berperilaku di bawah kebaruan, ketidakpastian, atau pergeseran tujuan.
Bahkan yang lebih penting, perilaku serupa dapat muncul dari proses yang berbeda secara fundamental. Dalam makalah lain, kami mengidentifikasi tujuh garis patahan epistemologis antara manusia dan LLM.
Misalnya, LLM tidak memiliki representasi internal dari apa yang benar. Mereka sering menghasilkan kontradiksi yang meyakinkan, terutama dalam interaksi yang lebih lama, karena mereka tidak melacak apa yang sebenarnya benar.
Contoh lain. Ya, LLM telah memecahkan beberapa masalah matematika terbuka, tetapi kasus-kasus ini biasanya melibatkan penerapan metode yang diketahui untuk masalah yang terdefinisi dengan baik. LLM tidak dapat menemukan apa pun yang benar-benar baru dan benar pada saat yang sama, karena mereka tidak memiliki mesin epistemik untuk menentukan apa yang benar.
Tak satu pun dari ini berarti LLM tidak berguna. Justru sebaliknya: mereka sangat berguna.
Tetapi kita harus berhati-hati tentang apa itu dan apa yang bukan.
Menghasilkan teks yang masuk akal tidak sama dengan memahami.
Prediksi statistik tidak sama dengan kecerdasan.
Jadi terlepas dari hype dari tersangka biasa, AGI belum tercapai.
*
makalah dalam balasan pertama
Bersama dengan @Walter4C dan @GaryMarcus

Teratas
Peringkat
Favorit
