Selen låter dig komma mycket längre bara genom att yolo, men prestandan kan förbättras dramatiskt med lite profilering. Vad tar upp kontexten? Vad tar upp platsen, titta på spåren. Vad som tränger sig på i minnet. Vad är det som är fel och att du kastar fel? Vad tar alldeles för lång tid (300 gånger för lång tid)? För att det laddas i FP32 istället för FP16 och byts ut i systemminnet
Vilka är modellens benägenheter? Vad kan du bygga i miljön för att förbättra kapaciteten baserat på dessa tendenser? Hur kan du förbättra långsiktig sammanhang och minne
50