bro går uformelt gjennom og forklarer 5 metoder for optimalisering av GPU-ytelse for LLM-er. En av de enkleste og mest intuitive forklaringene for nybegynnere.