Użyli vLLM do benchmarkingu TPU nie są do tego zoptymalizowane Dlatego uzyskują zły wynik