Tutorial altamente raccomandato: Introduzione alla programmazione CUDA per sviluppatori Python. Tratta di: - Come i kernel si mappano su migliaia di thread GPU - Cosa significano le dimensioni dei blocchi e dei thread - Perché la divergenza dei warp è importante per le prestazioni