Ba năm của Bài kiểm tra Lem, từ khi phát hành ChatGPT-3.5 (mặc dù lúc đó không được gọi như vậy) đến Claude Sonnet 4.5.