观察:关于机器学习/人工智能,有几本不错的基础书籍: Bishop & Bishop: 深度学习 Fleuret: 从第一原则学习理论 Hardt & Recht: 模式、预测与行动 然而,它们都没有详细或完全涵盖变压器。问题:你能推荐一些关于变压器和后续深度学习的优秀研究生水平书籍吗?请在回复中添加。