Açık modeller 2,5 kat daha hızlı, 6 kat daha pahalı gösteriyor Daha düşük parti büyüklüğü, spekülatif çözümleme daha zor Deepseek için pareto optimal eğri bunu gösteriyor Claude Opus 4.6 kullanıcı başına 100 Tok/s 100 seviyede Deepseek 6k Tok/s/GPU demek. 250 tok/s/kullanıcı ile 1k'ya daha yakın