O cache de prompts é a otimização mais custo-benefício que você pode oferecer para seus fluxos de trabalho e agentes baseados em LLMs. Neste post, abordo dicas para acessar o cache de prompts de forma mais consistente e como ele funciona por trás (provavelmente o primeiro recurso desse tipo)