Tres años de la Prueba Lem, desde el lanzamiento de ChatGPT-3.5 (aunque en ese momento no se llamaba así) hasta Claude Sonnet 4.5.