FlashAttention mungkin adalah kontribusi "AI PhD" terbaik: > menghabiskan waktu bertahun-tahun untuk belajar > memahami hal-hal lebih baik daripada orang lain > menulis ulang kode tingkat rendah dengan cara yang lebih cerdas > membuat transformator 2-4x lebih cepat > pada dasarnya makan siang gratis > sekarang berjalan di semua komputer kita