DApp Store | Centrum Web3 pro události a hry

Populární témata

Právě jsme sloučili podporu pro Parameter Efficient Fine-Tuning (🤗PEFT) v LeRobotu. To znamená, že nyní můžete používat metody jako nízkoúrovňové adaptéry (LoRA) pro trénování předtrénovaných politik jako Pi0 a SmolVLA.

To má dvě výhody: 1. U menších politik jako SmoLVLA můžete použít větší velikosti dávek a rychlost učení pro urychlení konvergence. 2. U větších politik, jako je Pi0, školení s PEFT umožňuje používat během školení mnohem méně VRAM.

27

Top

Hodnocení

Oblíbené