Мы только что объединили поддержку Parameter Efficient Fine-Tuning (🤗PEFT) в LeRobot. Это означает, что теперь вы можете использовать такие методы, как адаптеры низкого ранга (LoRA), для обучения ваших предварительно обученных политик, таких как Pi0 и SmolVLA.
Это имеет два преимущества: 1. Для более мелких политик, таких как SmoLVLA, вы можете использовать большие размеры пакетов и скорости обучения, чтобы ускорить сходимость. 2. Для более крупных политик, таких как Pi0, обучение с PEFT позволяет использовать гораздо меньше VRAM во время обучения.
55