他们使用 vLLMs 进行基准测试 TPUs 并未针对其进行优化 所以他们得到了一个糟糕的分数