Esegui un'inferenza da 70B con una singola GPU da 4GB