promptcaching är den mest prisvärda optimeringen du kan göra för dina LLM-baserade arbetsflöden och agenter. I det här inlägget tar jag upp tips för att hitta promptcachen mer konsekvent och hur den fungerar under huven (förmodligen den första resursen i sitt slag)