Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Christian Szegedy
#deeplearning, ilmuwan penelitian #ai. Pendapat adalah milik saya.
Christian Szegedy memposting ulang
Makalah ini membuat klaim yang berani!
Momen AlphaGo untuk Penemuan Arsitektur Model
Para peneliti memperkenalkan ASI-Arch, Kecerdasan Super Buatan pertama untuk Penelitian AI (ASI4AI), memungkinkan inovasi arsitektur saraf yang sepenuhnya otomatis.
Tidak ada ruang pencarian yang dirancang manusia. Tidak ada manusia dalam lingkaran.
🔍 Terobosan Utama ASI-Arch:
- Pembuatan & pelatihan kode otonom
- 1.773 eksperimen dilakukan (20K+ jam GPU)
- 106 arsitektur perhatian linier SOTA baru ditemukan
- Meluncurkan undang-undang penskalaan untuk penemuan ilmiah

33,15K
Christian Szegedy memposting ulang
⏱️AI membuat proses verifikasi lebih mudah, dengan model memverifikasi bukti dalam hitungan menit.
💻 Sekarang, @prfsanjeevarora, @chijinML, @danqi_chen dan @PrincetonPLI telah merilis Goedel Prover V2, model yang lebih efisien dan lebih akurat daripada model sebelumnya.
👉

16,06K
Christian Szegedy memposting ulang
Versi lanjutan Gemini dengan Deep Think telah secara resmi mencapai kinerja tingkat medali emas di Olimpiade Matematika Internasional. 🥇
Ini memecahkan 5️⃣ dari 6️⃣ masalah yang sangat sulit, yang melibatkan aljabar, kombinatorika, geometri dan teori bilangan. Begini caranya 🧵

6,7K
Christian Szegedy memposting ulang
BatchNorm memenangkan Penghargaan Test-of-Time di #ICML2025! 🎉
BatchNorm merevolusi pembelajaran mendalam dengan mengatasi pergeseran kovariat internal, yang dapat memperlambat pembelajaran, membatasi tingkat pembelajaran, dan menyulitkan untuk melatih jaringan mendalam.
Dengan menormalkan input dalam setiap batch mini, BatchNorm secara signifikan menstabilkan dan mempercepat pelatihan. Ini memungkinkan tingkat pembelajaran yang lebih tinggi, meningkatkan aliran gradien, dan membuka jalan bagi arsitektur yang jauh lebih dalam seperti ResNet.
Selain mengurangi pergeseran kovariat internal, BatchNorm juga memperlancar lanskap pengoptimalan dan meningkatkan generalisasi model, menjadikannya landasan pelatihan jaringan saraf modern.
Sangat layak, @Sergey_xai dan @ChrSzegedy!

9,71K
Christian Szegedy memposting ulang
Kertas @Scale_AI baru! 🌟
LLM yang dilatih dengan RL dapat mengeksploitasi peretasan hadiah tetapi tidak menyebutkan ini di CoT mereka. Kami memperkenalkan penyempurnaan verbalisasi (VFT)—mengajarkan model untuk mengatakan kapan mereka merebut peretasan—secara dramatis mengurangi tingkat peretasan yang tidak terdeteksi (6% vs. baseline 88%).

16,91K
Ceri seukuran melon di atas :)

Shane Gu11 Jul, 06.22
2023: at OpenAI, some key figs in post-training were against scaling RL.
2022: Eric/Yuhuai (now xAI) wrote STaR and I wrote "LLM can self-improve". It was clear that RL on clean signals unlocks the next leap.
Pre/post-training divide may have been a big slowdown to AI.

13,57K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal