Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vi brukte Karpathy Auto Research på sjakk gjennom Opal, og resultatene var sterke.
I stedet for å stole på åpne bøker eller memorert teori, lærer systemet direkte av resultatene. Agenten spiller kamper mot seg selv, vurderer posisjoner med en motor, oppdaterer policyen og kjører loopen på nytt.
Over tid forsterkes denne tilbakemeldingssyklusen.
Selvspill -> Evaluering -> Policyoppdatering -> Gjenta.
Resultatet var en forbedring i ELO med +596.
Når læringsløkken er tett, akselererer forbedringen raskt.

Topp
Rangering
Favoritter
