prompt caching er den mest verdifulle optimaliseringen du kan gjøre for dine LLM-baserte arbeidsflyter og agenter. I dette innlegget dekker jeg tips for å treffe prompt-cachen mer konsekvent og hvordan den fungerer under panseret (sannsynligvis den første slike ressursen)