Granite 4.0 H Tiny (4-biters) fra @IBM kjører på iPhone 17 Pro med ~40 tk/s med MLX 7B totale parametere med 1B aktiv som bruker mindre enn 5 GB RAM, ekstremt bra i benchmarks for minnefotavtrykket IBM gjorde en god jobb med denne, den er rask og effektiv for størrelsen