¿Alguna recomendación sobre textos que introduzcan cómo se abordan la memoria en los modelos de transformadores? Debería ser de nivel introductorio sin sacrificar la especificidad técnica. ¿Vale la pena escribir uno?