Mudamos a forma como a taxa de transferência é calculada no OpenRouter para incluir a latência inicial no endpoint. Isso fará com que os números caiam para alguns endpoints open source, mas refletirá melhor a velocidade real que os usuários finais percebem e impedirá que os endpoints agrupem tokens para melhorar as estatísticas de throughput.