Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

hardmaru
Bygge kollektiv intelligens @SakanaAILabs 🧠
hardmaru lagt ut på nytt
Menneskeheten har seiret (foreløpig!)
Jeg er helt utslitt. Jeg tenkte at jeg hadde 10 timers søvn de siste 3 dagene, og jeg er knapt i live.
Jeg skal legge ut mer om konkurransen når jeg får litt hvile.
(For å være tydelig, det er foreløpige resultater, men ledelsen min bør være stor nok)

1,98M
hardmaru lagt ut på nytt
1 tiår siden: Reinforcement Learning Prompt Engineer i avsnitt 5.3 av «Lære å tenke ...» [2]. Adaptiv tankekjede! Et RL-nett lærer å spørre et annet nett for abstrakt resonnement og beslutningstaking. Går utover verdensmodellen fra 1990 for planlegging av millisekund for millisekund [1].
[2] J. Schmidhuber (JS, 2015). «Om å lære å tenke: Algoritmisk informasjonsteori for nye kombinasjoner av RL-kontrollere og tilbakevendende nevrale verdensmodeller.» ArXiv 1210.0118
[1] JS (1990). "Å gjøre verden differensierbar: Om å bruke fullt tilbakevendende selvovervåkede nevrale nettverk for dynamisk forsterkende læring og planlegging i ikke-stasjonære miljøer.» TR FKI-126-90, TUM. (Denne rapporten introduserte også kunstig nysgjerrighet og indre motivasjon gjennom generative kontradiktoriske nettverk.)

23,41K
hardmaru lagt ut på nytt
Hvis du tenker på verdensmodeller eller nevrale simuleringer og ikke vet hvor du skal begynne, sjekk ut OG-artikkelen om verdensmodeller fra @hardmaru og @SchmidhuberAI
- Det er superklart å lese og få det grunnleggende
- du kan reprodusere den på din Mac eller en hvilken som helst lokal maskin
- Du kan stadig oppgradere den og bli enda kraftigere
Hvis Karpathy ville lære verdensmodeller, er dette artikkelen han ville dykket dypt ned i.
13,51K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til