DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

andrej karpathy liet zijn laptop twee dagen aanstaan.. kwam terug en zijn agent had ~700 experimenten uitgevoerd en ~20 verbeteringen gevonden die hij had gemist het was gericht op nanochat, een klein gpt-stijl model dat hij al met de hand had afgesteld.. karpathy zegt dat de agent de "tijd naar gpt 2" met ~11% heeft verminderd, en de winst werd overgedragen van het kleine model naar grotere modellen de mechanismen zijn eigenlijk best saai: vaste trainingsruns van 5 minuten, scoren op één metric, wat verbetert behouden, wat niet verbetert terugdraaien, herhalen.. ~12 experimenten/uur betekent dat je wakker wordt met ~100 pogingen die je niet persoonlijk hebt uitgevoerd Tobi Lütke probeerde hetzelfde idee op de liquid codebase van shopify en meldde ~53% sneller met 61% minder objectallocaties (met de kanttekening dat het mogelijk overfit is).. maar de ideeën waren nog steeds nuttig - zelfs in een 20 jaar oud, zwaar geoptimaliseerd project we hebben gewoon het traagste deel van engineering en onderzoek geautomatiseerd.. onophoudelijke iteratie jij schrijft het .md bestand.. de agent schrijft de .py 👀

Boven

Positie

Favorieten