觀察:有幾本關於機器學習/人工智慧的好基礎書籍: Bishop & Bishop: 深度學習 Fleuret: 從第一原則學習理論 Hardt & Recht: 模式、預測與行動 然而,這些書籍中沒有一本詳細或完全涵蓋變壓器。問題:你能推薦一些好的研究生級別的變壓器和後續深度學習書籍嗎?請在回覆中添加。