LFM2.5, mlx-lm ile M5 dizüstü bilgisayarda oldukça hızlı ön doldurma sağlıyor. Tam hassasiyet modeli, 28k token isteğini < 6 saniyede (>5k tok/s) işliyor. Sinir hızlandırıcılı küçük cihazlar için çok iyi bir model olabilir.