三年的Lem測試,從ChatGPT-3.5的發布(雖然當時並不是這樣稱呼)到Claude Sonnet 4.5。