M5 Max on 3 500 dollarin lelu ainoa numero, jolla on merkitystä paikalliselle tekoälylle: tokenit/sec mikä oikeasti merkitsee LLM-päättelylle (järjestyksessä): Muistikaistanleveys → määrittää tok/s:n VRAM/yhtenäinen muisti → määrittää mallin koon Laskennan → ei juuri merkitse päättelyä 25 tokenia/s 70B:llä kuulostaa vaikuttavalta, kunnes huomaat, että agenttinen tekoäly tarvitsee 100+, jotta se ei tunnu rikkinäiseltä M5 on loistava kannettava, mutta ei palvelinmateriaali