LFM2.5 memiliki prefill yang cukup cepat pada laptop M5 dengan mlx-lm. Model presisi penuh memproses prompt token 28k dalam < 6 detik (>5k tok/s). Bisa menjadi model yang sangat bagus untuk perangkat kecil dengan akselerator saraf.