⭐️ π₀-FAST الآن في LeRobot ⭐️ أنا متحمس لمشاركة أحدث أعمالي في @LeRobotHF: إدخال π₀-FAST بالكامل إلى المجموعة. كان تنفيذ Pi-FAST الأصلي متاحا فقط في JAX، لذا أعدنا بنائه في PyTorch، بدءا من π₀، بما في ذلك هدف فقدان الإنتروبيا المتقاطعة، ونظام الترميز FAST، وتحسينات الاستنتاج مثل التخزين المؤقت KV. π₀-FAST هو أكثر نماذج الرؤية واللغة والعمل الذاتي الانحدار حتى الآن حتى الآن من قبل @physical_int. يتضمن رمزا مدمجا للإجراءات يدعى FAST، الذي يحول الإجراءات المستمرة إلى رموز منفصلة (مثل ضغط JPEG). هذا يعني أنه يمكن تدريب π₀-FAST باستخدام تنبؤ الرمز التالي على طريقة نموذج اللغة الكبيرة. بمجرد أن يصبح كل شيء رموزا، تفتح الكثير من الأبواب أمام المجتمع: > يمكنك تدريب π₀-FAST بسهولة مع هدف الرمز التالي عبر مجموعات البيانات، والتجسيد، وحتى أنواع الرموز الجديدة (صناديق الحدود، اللغة، الإدراك الذاتي؛ كلها رموز). لاحظ أن التنبؤ بالرمز التالي يتطور بسرعة ~5× أسرع من الانتشار أو مطابقة التدفق. > إعادة استخدام نفس الأوزان وضبط هدف مطابقة التدفق على مهمتك المستهدفة للحصول على استنتاج أسرع. يمكنك أيضا تدريب توكنizer FAST الخاص بك على أي مجموعة بيانات LeRobot باستخدام أمر 'lerobot-train-tokenizer'. رائع جدا. على جانب الأنظمة، أضفنا تخزين مؤقت على شكل نموذج LLM في KV عند الاستنتاج، مما أعطى تسارعا ~5× لفك الترميز التلقائي. قمنا بتقييم LIBERO وحققنا نجاحا بنسبة 82.5٪ @ 40 ألف خطوة (ارتفاعا من ~40٪ عند نقلها لأول مرة العام الماضي). هذا يمهد الطريق لوصفات هجينة ل AR + مطابقة التدفق وعزل معرفي بأسلوب π₀.₅ داخل LeRobot. 👉 وثائق: 🤖 نقطة تفتيش قاعدة Pi0Fast: