Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Det er ærlig talt litt sprøtt at jeg har de raskeste pikslene til policy-forsterkende læringstreningsrammeverk i hele verden, på 100k trekanter og 16k unike masker og 16k unike verdener.
Alt på en enkelt 4090. 10 minutter på enkle oppgaver
Det er noen flotte ting med det. Veldig raske spørsmål om verdensattributter i forhold til posisjoner av ting, attributter som hva som er den nærmeste overflaten. Minnet eksploderer ikke, kan skalere opp til 100k unike verdener i minnet hvis jeg vil, ved å slå sammen eiendeler. Levende prosedyregenerering
Plug and play-ressurser for verden. Jeg kan prosessuelt generere mesh-verdener med manifoldcad hvis jeg vil, og fortsette å generere nye verdener under trening. Mange retningslinjer sliter med å huske, men ikke min. Hver episode kan være en ny verden hvis jeg vil at den skal være det
Tilpassede gjengivelsesordninger for å akselerere opplæringen. Jeg kan gjøre foveated rendering slik at jeg kan RL lære et faktisk øyeeple, som piler rundt for å finne ut hvor agenten er plassert. Og den lærer faktisk. 1m, 2m skritt per sekund. Med to GPUer kan jeg kjøre 12 eksperimenter på en time
Jeg kan få dybdeoppfatning gratis på grunn av verdensmotoren min. Jeg kan modellere og fysikk jeg vil ved å injisere en pytorch-funksjon som grupperer operasjonene på tvers av alle verdener. *Fordi* jeg kan kjøre så mange eksperimenter i så ekstreme hastigheter, og det er så konfigurerbart at jeg lærer så mye
Jeg har trent en modell til å utforske en leilighet med bare TRE dybdespørringer. Var det lett? Nei. Det krevde mange eksperimenter. Men fordi jeg kan løpe 100 om dagen, gjør jeg 100 ganger fremgangen. Jeg har funnet ut hvordan jeg kan holde den juuuuust riktig *fordi* fremgangen min er 100 ganger raskere enn din
Jeg har kode som rutenett søker over alle vinkler, og jeg har kode som gjengir policyens oppførsel, og jeg har kode som kjører statistikken på dem alle og live-oppdaterer et diagram som jeg kan se på, og jeg har kode som kjører flere eksperimenter på flere maskiner
Jeg har i utgangspunktet jobbet med dette i 2 måneder til sammen, perforert av maskinvare- og fastvarearbeid. Treningsløpene mine pleide å ta 10 timer, og nå tar de 10 minutter. Jeg tror ikke du egentlig forstår hva dette betyr. 10 minutter
Moren min pleide å skrive c++ for transaksjonsbankprogramvare på 90-tallet, og kompileringstidene hennes var lengre. Hele treningssløyfen min på prosedyregenererte RENDERTE VERDENER er raskere enn hvor lang tid det tok moren min å kjøre integrasjonstester på databasetransaksjonsprogramvare
Jeg har skrevet om gjengivelsesmotoren min og trenerintegrasjonen min (pufferlib-utvidelse spesifikk for kun GPU-trening, så hele sløyfen min kjører naturlig på GPU) og min eksperimenterings-/utrullingsvisualiseringsprogramvare og min verdensgenerasjonsprogramvare tre ganger nå. Enkeltvis.
Den enkle hastigheten på loopen min gjør en haug med arbeid som ikke engang var verdt å prøve verdt å gjøre i dag. Jeg kommer til å gjøre så mye dum dritt som aldri er gjort før
Jeg ble fortalt at piksler var en dårlig idé fordi det var tregt, men all programvare kan lages raskt. Det er ikke engang så vanskelig.
Jeg tror ikke dere forstår. Jeg har trent en policy som bruker INGENTING ANNET ENN PIKSLER (!) SOM KAN STYRE FYSIKK med 4 kontrollkanaler som bokstavelig talt HUSKER hvilke rom den allerede har besøkt og UNNGÅ KOLLISJONER ved 20hz uten TILSTAND.
900k parametere
Forstår du?
Jeg kommer til å vinne.
Ikke litt. Ikke ved å gjøre det alle andre gjør. Ved å gjøre det ingen andre har baller til å gjøre. Bare å gjøre det som er åpenbart, tilsynelatende bare for meg
Jeg kommer til å vinne

@ChrisRemboldt (ja!)
20,61K
Topp
Rangering
Favoritter

