otimização da inferência para GPUs L4. consumo máximo de energia 72 W