LFM2.5 ma dość szybkie wypełnianie na laptopie M5 z mlx-lm. Model o pełnej precyzji przetwarza 28k tokenów w < 6 sekund (>5k tok/s). Może to być bardzo ładny model dla małych urządzeń z akceleratorami neuronowymi.