bro caminha casualmente e explica 5 métodos de otimização de desempenho de GPU para LLMs. uma das explicações mais simples e intuitivas para iniciantes.