Các LLM sẽ dễ dàng hơn 100 lần để xây dựng những thứ thú vị nếu bạn không phải tối ưu hóa cho các lần truy cập bộ nhớ đệm, thật lòng mà nói.