2,5x szybsze, ale 6x droższe. Nie można tego osiągnąć dzięki optymalizacji wnioskowania, muszą to być nowe chipy. TPU? B200? AWS Inferentia? Cerebras?