Jensen đưa ra câu trả lời đúng Như bạn có thể thấy, ở mức thấp token/giây/người dùng (50-100 token), mức tăng thông lượng ít hơn 1.6x. Nhưng khi chúng ta tăng lên 200-250 token/giây/người dùng, mức tăng thông lượng vượt quá 10x