Наблюдение: есть несколько хороших основополагающих книг о ML/AI: Bishop & Bishop: Глубокое обучение Fleuret: Теория обучения с первых принципов Hardt & Recht: Шаблоны, предсказания и действия и все же ни одна из них не охватывает трансформеры подробно или вообще. Вопрос: можете порекомендовать хорошие книги для аспирантов по трансформерам и позднему глубокому обучению? Добавьте в ответы.