Observación: hay algunos buenos libros fundamentales sobre ML/AI: Bishop & Bishop: Deep Learning Fleuret: Learning Theory from First Principles Hardt & Recht: Patterns, Predictions and Actions y, sin embargo, ninguno de ellos cubre los transformadores en detalle o en absoluto. Pregunta: ¿puedes recomendar buenos libros de nivel de posgrado sobre transformadores y luego DL? Añade en las respuestas.