2,5 kat daha hızlı ama 6 kat daha pahalı. Bu çıkarım optimizasyonuyla sağlanamaz, yeni çipler olmalı. TPU mu? B200? AWS Inferentia? Serebra mı?