Execute uma inferência de 70B com uma única GPU de 4GB