LeRobotではParameter Efficient Fine-Tuning(🤗PEFT)のサポートを統合しました。 これにより、Pi0やSmolVLAのような事前学習済みポリシーの訓練に、低ランクアダプター(LoRA)のような手法を使えるようになりました。
これには2つの利点があります。1. SmoLVLAのような小規模なポリシーでは、より高いバッチサイズや学習率を活用して収束を加速できます。2. Pi0のような大きなポリシーの場合、PEFTでのトレーニングはトレーニング中にVRAMの使用を大幅に減らせます。
32