⭐️ π₀-FASTは現在LeRobot ⭐️に所属しています。 @LeRobotHF年の最新作、π₀-FASTを完全にスタックに取り入れることを楽しみにしています。 元のPi-FAST実装はJAXのみで利用可能だったため、PyTorchでπ₀から再構築し、クロスエントロピー損失の目的、FASTトークン化スキーム、KVキャッシュなどの推論最適化を含めました。 π₀-FASTは、@physical_int年までに最も高度な自己回帰的ビジョン・言語・行動モデルです。内蔵のアクショントークナイザーであるFASTがあり、連続アクションを離散トークン(JPEG圧縮のように)に変換します。 つまり、π₀-FASTはLLMスタイルの次トークン予測で訓練可能です。 すべてがトークンになると、コミュニティには多くの扉が開かれます: > データセット、身体、さらには新しいトークンタイプ(バウンディングボックス、言語、固有受容感など)を横断して、次トークン目標でπ₀-FASTを簡単に事前学習できます。次トークン予測は拡散やフローマッチングよりも速く~5×速く列車を進めることに注意してください。 > 同じ重みを再利用し、目標タスクにフローマッチング目標を付けてファインチューニングし、より速い推論を行ってください。 また、「lerobot-train-tokenizer」コマンドを使って、任意のLeRobotデータセットで自分だけのFASTトークナイザーを訓練することも可能です。すごくクールです。 システム側では、推論時にLLMスタイルのKVキャッシュを追加し、自己回帰復号のために~5×の高速化を実現しました。 LIBEROで評価したところ、4万歩で82.5%の成功率を記録しました(昨年初めて移植された時の~40%から増加)。 これにより、ハイブリッドAR+フローマッチングレシピやπ₀.₅スタイルの知識隔離がLeRobot内で実現します。 👉 医師: 🤖 Pi0Fast基地チェックポイント: