Nytt blogginnlegg ute! Raskere LLM-er ved hjelp av lineære oppmerksomhetsmekanismer. Matematisk forklaring og avveininger.