Alguma recomendação sobre textos que introduzem como abordagens à memória em modelos de transformadores? Deve ser de nível introdutório sem sacrificar a especificidade técnica. Vale a pena escrever um?