DApp Store | Centrum Web3 pro události a hry

Populární témata

⭐️ π₀-FAST je nyní v LeRobotu ⭐️ Těším se, že mohu sdílet svou nejnovější práci v roce @LeRobotHF: plně začlenit π₀-FAST do celého stacku. Původní implementace Pi-FAST byla dostupná pouze v JAX, takže jsme ji přestavěli v PyTorch, začínaje od roku π₀, včetně cíle ztráty přes entropii, tokenizačního schématu FAST a optimalizací inference jako je KV caching. π₀-FAST je dosud nejpokročilejší autoregresní model Vision-Language-Action od roku @physical_int. Obsahuje vestavěný tokenizér akcí FAST, který přeměňuje kontinuální akce na diskrétní tokeny (například komprese JPEG). To znamená, že π₀-FAST lze trénovat pomocí predikce dalšího tokenu ve stylu LLM. Jakmile je vše tokeny, otevře se komunitě mnoho dveří: > Snadno předtrénujte π₀-FAST s cílem dalšího tokenu napříč datovými sadami, embomenty a dokonce i novými typy tokenů (ohraničující boxy, jazyk, propriocepce; vše jsou tokeny). Všimněte si, že predikce dalšího tokenu se trénuje ~5× rychleji než difuze nebo shoda průtoku. > Znovu použijte stejné váhy a doladěte s cílem shody toku na cílové úlohě pro rychlejší odvozování. Můžete také trénovat vlastní FAST tokenizer na jakémkoli LeRobot datasetu pomocí příkazu 'lerobot-train-tokenizer'. To je fakt super. Na straně systémů jsme při inferenci přidali KV-caching ve stylu LLM, což přináší ~5× zrychlení pro autoregresní dekódování. Hodnotili jsme to na LIBERO a dosáhli jsme 82,5 % úspěšnosti @ 40 tisíc kroků (nárůst oproti ~40 % při prvním portu loni). To vytváří základy pro hybridní AR + recepty pro porovnávání toku a izolaci znalostí ve stylu π₀.₅ uvnitř LeRobotu. 👉 Dokumentáci: 🤖 Pi0Fast kontrolní bod základny:

Top

Hodnocení

Oblíbené