Drei Jahre des Lem-Tests, von der Veröffentlichung von ChatGPT-3.5 (obwohl es damals nicht so genannt wurde) bis zu Claude Sonnet 4.5.