бро спокойно идет и объясняет 5 методов оптимизации производительности GPU для LLM. одно из самых простых и интуитивно понятных объяснений для новичков.