FlashAttention 可能是终极的 "AI 博士学位" 贡献: > 花费多年学习 > 比其他人更好地理解事物 > 以更智能的方式重写低级代码 > 使变换器速度提高 2-4 倍 > 本质上是免费的午餐 > 现在它在我们所有的计算机上运行