O vllm está avariado? Como é que dois pedidos idênticos podem produzir saídas diferentes? Temperatura 0.0, semente 42 - como é que se pode garantir determinismo?