Právě jsme sloučili podporu pro Parameter Efficient Fine-Tuning (🤗PEFT) v LeRobotu. To znamená, že nyní můžete používat metody jako nízkoúrovňové adaptéry (LoRA) pro trénování předtrénovaných politik jako Pi0 a SmolVLA.
To má dvě výhody: 1. U menších politik jako SmoLVLA můžete použít větší velikosti dávek a rychlost učení pro urychlení konvergence. 2. U větších politik, jako je Pi0, školení s PEFT umožňuje používat během školení mnohem méně VRAM.
27