optimizando la inferencia para GPUs L4. consumo máximo 72 W