Ba năm của Bài kiểm tra Lem, từ khi phát hành ChatGPT-3.5 (mặc dù lúc đó nó không được gọi như vậy) đến Claude Opus 4.5 tuần trước.