FlashAttention er sannsynligvis det ultimate "AI PhD"-bidraget: > bruker år på å studere > forstår ting bedre enn alle andre > omskrive lavnivåkode på en mer intelligent måte > gjør transformatorer 2-4 ganger raskere > egentlig en gratis lunsj > nå kjører den på alle datamaskinene våre