Åpne modeller viser 2,5 ganger raskere, 6 ganger dyrere Lavere batchstørrelse, spekulativ dekoding vanskeligere Pareto-optimal kurve for Deepseek viser dette Claude Opus 4.6 har 100 Tok/s/bruker Deepseek på 100 er 6k Tok/s/GPU Med 250 tok/s per bruker er det nærmere 1 000