LFM2.5 має досить швидке передзаповнення на ноутбуці M5 з mlx-lm. Модель повної точності обробляє запит на 28k токена за < 6 секунд (>5k tok/s). Може бути дуже гарною моделлю для невеликих пристроїв із нейронними прискорювачами.