Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Christian Szegedy
#deeplearning, #ai cercetător științific. Părerile sunt ale mele.
Christian Szegedy a repostat
Această lucrare face o afirmație îndrăzneață!
Momentul AlphaGo pentru descoperirea arhitecturii modelului
Cercetătorii introduc ASI-Arch, prima superinteligență artificială pentru cercetarea AI (ASI4AI), permițând inovarea arhitecturii neuronale complet automatizate.
Fără spațiu de căutare proiectat de om. Niciun om în buclă.
🔍 Principalele descoperiri ale ASI-Arch:
- Generarea și instruirea autonomă a codului
- 1.773 de experimente efectuate (20K+ ore GPU)
- 106 noi arhitecturi de atenție liniară SOTA descoperite
- A dezvăluit o lege de scalare pentru descoperirea științifică

33,15K
Christian Szegedy a repostat
O versiune avansată a Gemenilor cu gândire profundă a obținut oficial o performanță la nivel de medalie de aur la Olimpiada Internațională de Matematică. 🥇
A rezolvat 5️⃣ din ⃣ probleme excepțional de 6️dificile, implicând algebră, combinatorică, geometrie și teoria numerelor. Iată cum 🧵

6,7K
Christian Szegedy a repostat
BatchNorm câștigă premiul Test-of-Time la #ICML2025! 🎉
BatchNorm a revoluționat învățarea profundă prin abordarea schimbării covariabilelor interne, care poate încetini învățarea, limitează ratele de învățare și îngreunează antrenarea rețelelor profunde.
Prin normalizarea intrărilor din fiecare mini-lot, BatchNorm a stabilizat și accelerat semnificativ antrenamentul. A permis rate de învățare mai mari, a îmbunătățit fluxul de gradient și a deschis calea pentru arhitecturi mult mai profunde, cum ar fi ResNet.
Dincolo de reducerea schimbării covariabilelor interne, BatchNorm netezește peisajul de optimizare și îmbunătățește generalizarea modelului, făcându-l o piatră de temelie a antrenamentului modern al rețelelor neuronale.
Foarte bine meritat, @Sergey_xai și @ChrSzegedy!

9,71K
Christian Szegedy a repostat
O nouă hârtie @Scale_AI! 🌟
LLM-urile antrenate cu RL pot exploata hack-urile de recompensă, dar nu menționează acest lucru în CoT. Introducem reglarea fină a verbalizării (VFT) – învățarea modelelor să spună când recompensează hackingul – reducând dramatic rata de hacking nedetectat (6% față de 88%).

16,91K
O cireașă de mărimea unui pepene galben deasupra :)

Shane Gu11 iul., 06:22
2023: at OpenAI, some key figs in post-training were against scaling RL.
2022: Eric/Yuhuai (now xAI) wrote STaR and I wrote "LLM can self-improve". It was clear that RL on clean signals unlocks the next leap.
Pre/post-training divide may have been a big slowdown to AI.

13,58K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante