un chico camina casualmente y explica 5 métodos de optimización del rendimiento de GPU para LLMs. una de las explicaciones más simples e intuitivas para principiantes.