Modele otwarte pokazują 2,5x szybsze, 6x droższe Niższy rozmiar partii, trudniejsza dekodowanie spekulacyjne Krzywa Pareto optymalna dla Deepseek pokazuje to Claude Opus 4.6 to 100 Tok/s/użytkownika Deepseek przy 100 to 6k Tok/s/GPU Przy 250 tok/s/użytkownika jest bliżej 1k