Nova funcionalidade de desempenho útil: Ordenação de Partições Crie um piso de desempenho para priorizar LLMs rápidas, sem impacto de latência.
Você pode definir `preferred_min_throughput` e `preferred_max_latency`. Como antes, você também pode definir um limite de custo.
65