DApp Store | Web3 Hub for hendelser og spill

Populære emner

⭐️ π₀-FAST er nå i LeRobot ⭐️ Jeg gleder meg til å dele mitt nyeste arbeid i @LeRobotHF: å bringe π₀-FAST fullt inn i stacken. Den opprinnelige Pi-FAST-implementeringen var kun tilgjengelig i JAX, så vi bygde den om i PyTorch, med start fra π₀, inkludert kryssentropi-tapsmålet, FAST-tokeniseringsskjemaet og inferensoptimaliseringer som KV-caching. π₀-FAST er den mest avanserte autoregressive Vision-Language-Action-modellen til dags dato @physical_int. Den inkluderer en innebygd handlingstokenizer, FAST, som gjør kontinuerlige handlinger om til separate tokens (som JPEG-komprimering). Det betyr at π₀-FAST kan trenes med LLM-lignende next-token-prediksjon. Når alt er tokens, åpnes mange dører for fellesskapet: > Enkelt forhåndstren π₀-FAST med et neste-token-mål på tvers av datasett, embodiments og til og med nye token-typer (bounding boxes, språk, propriosepsjon; det er alle tokens). Merk at next-token-prediksjon trener ~5× raskere enn diffusjon eller flow-matching. > gjenbruk de samme vektene og finjuster med et flow matching-mål på måloppgaven for raskere slutning. Du kan også trene din egen FAST-tokenizer på hvilket som helst LeRobot-datasett ved å bruke kommandoen 'lerobot-train-tokenizer'. Så kult. På systemsiden la vi til LLM-lignende KV-caching ved inferens, noe som gir en hastighetsøkning på ~5× for autoregressiv dekoding. Vi evaluerte på LIBERO og nådde 82,5 % suksess @ 40 000 steg (opp fra ~40 % da det først ble portet i fjor). Dette legger grunnlaget for hybride AR + flytmatchende oppskrifter og π₀.₅-aktig kunnskapsisolasjon inne i LeRobot. 👉 Dokumenter: 🤖 Pi0Fast base-sjekkpunkt:

Topp

Rangering

Favoritter