FlashAttention es probablemente la última contribución de "AI PhD": > pasar años estudiando > entender las cosas mejor que los demás > reescribir código de bajo nivel de una manera más inteligente > hacer transformadores de 2 a 4 veces más rápido > esencialmente un almuerzo gratis > ahora se ejecuta en todas nuestras computadoras