o caching de prompts é a otimização que oferece o melhor retorno sobre o investimento que você pode fazer para seus fluxos de trabalho e agentes baseados em LLM. neste post, abordo dicas para acessar o cache de prompts de forma mais consistente e como ele funciona por trás das cenas (provavelmente o primeiro recurso desse tipo)