FlashAttention ist wahrscheinlich der ultimative "AI PhD" Beitrag: > Jahre mit Studium verbringen > Dinge besser verstehen als alle anderen > Low-Level-Code intelligenter umschreiben > Transformer 2-4x schneller machen > im Grunde ein kostenloses Mittagessen > jetzt läuft es auf all unseren Computern