Modelos abertos mostram 2,5 vezes mais rápido, 6 vezes mais caro Tamanho de lote menor, decodificação especulativa mais difícil A curva ótima de Pareto para Deepseek em mostra isso Claude Opus 4.6 é 100 Tok/s/usuário Deepseek em 100 é 6k Tok/s/GPU Com 250 tok/s/usuário, é mais próximo de 1k