Exécutez une inférence de 70B avec un seul GPU de 4 Go