Um guia visual para o cache de KV em LLMs: