Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
andrej karpathy liet zijn laptop twee dagen aanstaan.. kwam terug en zijn agent had ~700 experimenten uitgevoerd en ~20 verbeteringen gevonden die hij had gemist
het was gericht op nanochat, een klein gpt-stijl model dat hij al met de hand had afgesteld.. karpathy zegt dat de agent de "tijd naar gpt 2" met ~11% heeft verminderd, en de winst werd overgedragen van het kleine model naar grotere modellen
de mechanismen zijn eigenlijk best saai: vaste trainingsruns van 5 minuten, scoren op één metric, wat verbetert behouden, wat niet verbetert terugdraaien, herhalen.. ~12 experimenten/uur betekent dat je wakker wordt met ~100 pogingen die je niet persoonlijk hebt uitgevoerd
Tobi Lütke probeerde hetzelfde idee op de liquid codebase van shopify en meldde ~53% sneller met 61% minder objectallocaties (met de kanttekening dat het mogelijk overfit is).. maar de ideeën waren nog steeds nuttig - zelfs in een 20 jaar oud, zwaar geoptimaliseerd project
we hebben gewoon het traagste deel van engineering en onderzoek geautomatiseerd.. onophoudelijke iteratie
jij schrijft het .md bestand.. de agent schrijft de .py 👀
Boven
Positie
Favorieten
