Tutorial altamente recomendado: Introdução à Programação CUDA para Desenvolvedores Python. Abrange: - Como os kernels se mapeiam para milhares de threads de GPU - O que significam os tamanhos de bloco e thread - Por que a divergência de warp é importante para o desempenho