المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
⭐️ π₀-FAST الآن في LeRobot ⭐️
أنا متحمس لمشاركة أحدث أعمالي في @LeRobotHF: إدخال π₀-FAST بالكامل إلى المجموعة.
كان تنفيذ Pi-FAST الأصلي متاحا فقط في JAX، لذا أعدنا بنائه في PyTorch، بدءا من π₀، بما في ذلك هدف فقدان الإنتروبيا المتقاطعة، ونظام الترميز FAST، وتحسينات الاستنتاج مثل التخزين المؤقت KV.
π₀-FAST هو أكثر نماذج الرؤية واللغة والعمل الذاتي الانحدار حتى الآن حتى الآن من قبل @physical_int. يتضمن رمزا مدمجا للإجراءات يدعى FAST، الذي يحول الإجراءات المستمرة إلى رموز منفصلة (مثل ضغط JPEG).
هذا يعني أنه يمكن تدريب π₀-FAST باستخدام تنبؤ الرمز التالي على طريقة نموذج اللغة الكبيرة.
بمجرد أن يصبح كل شيء رموزا، تفتح الكثير من الأبواب أمام المجتمع:
> يمكنك تدريب π₀-FAST بسهولة مع هدف الرمز التالي عبر مجموعات البيانات، والتجسيد، وحتى أنواع الرموز الجديدة (صناديق الحدود، اللغة، الإدراك الذاتي؛ كلها رموز). لاحظ أن التنبؤ بالرمز التالي يتطور بسرعة ~5× أسرع من الانتشار أو مطابقة التدفق.
> إعادة استخدام نفس الأوزان وضبط هدف مطابقة التدفق على مهمتك المستهدفة للحصول على استنتاج أسرع.
يمكنك أيضا تدريب توكنizer FAST الخاص بك على أي مجموعة بيانات LeRobot باستخدام أمر 'lerobot-train-tokenizer'. رائع جدا.
على جانب الأنظمة، أضفنا تخزين مؤقت على شكل نموذج LLM في KV عند الاستنتاج، مما أعطى تسارعا ~5× لفك الترميز التلقائي.
قمنا بتقييم LIBERO وحققنا نجاحا بنسبة 82.5٪ @ 40 ألف خطوة (ارتفاعا من ~40٪ عند نقلها لأول مرة العام الماضي).
هذا يمهد الطريق لوصفات هجينة ل AR + مطابقة التدفق وعزل معرفي بأسلوب π₀.₅ داخل LeRobot.
👉 وثائق:
🤖 نقطة تفتيش قاعدة Pi0Fast:
الأفضل
المُتصدِّرة
التطبيقات المفضلة
