Jensen ger rätt svar Som du kan se, vid låga tokens/sekund/användare (50-100 tokens) är genomströmningsökningen mindre än 1,6x. Men när vi går mot 200-250 token/sekund/användare är genomströmningsökningen över 10x