inference optimaliseren voor L4 GPU's. maximaal stroomverbruik 72 W