Öppna modeller visar 2,5 gånger snabbare, 6 gånger dyrare Lägre batchstorlek, spekulativ avkodning svårare Pareto-optimal kurva för Deepseek visar detta Claude Opus 4.6 är 100 Tok/s/användare Deepseek på 100 är 6k Tok/s/GPU Vid 250 tok/s per användare är det närmare 1 000