很高興分享,阿里巴巴在2025年NeurIPS會議上有146篇論文被接受,涵蓋模型訓練、數據集、基礎研究和推理優化,這在科技公司中名列前茅! 🚀我們的獲獎論文《大型語言模型的門控注意力:非線性、稀疏性和無注意力沉沒》,首次系統性探討了注意力門控如何影響大型模型的性能。 閱讀更多: #AlibabaAI