Tutorial altamente recomendado: Introdução à Programação CUDA para Desenvolvedores Python. Capas: - Como kernels mapeiam para milhares de threads de GPU - O que significam tamanhos de bloco e rosca - Por que a divergência de dobra importa para o desempenho