Open modellen tonen 2,5x sneller, 6x duurder Lagere batchgrootte, speculatieve decodering moeilijker Pareto optimale curve voor Deepseek toont dit aan Claude Opus 4.6 is 100 Tok/s/gebruiker Deepseek bij 100 is 6k Tok/s/GPU Bij 250 tok/s/gebruiker is het dichter bij 1k