LFM2.5はM5ノートパソコンのmlx-lmでかなり高速なプリフィル機能を持っています。フルプレシジョンモデルは、28kトークンプロンプトを<6秒(>5k tok/s)で処理します。 ニューラルアクセラレーターを搭載した小型デバイス向けの非常に良いモデルになりそうです。