Otevřené modely ukazují 2,5x rychlejší, 6x dražší Menší velikost dávky, spekulativní dekódování je těžší Pareto optimální křivka pro Deepseek ukazuje toto Claude Opus 4.6 je 100 Tok/s/user Deepseek na 100 je 6k Tok/s/GPU Při 250 tok/s/uživatel je to blíže 1k