Tutorial altamente recomendado: Introducción a la programación CUDA para desarrolladores de Python. Cubre: - Cómo los kernels se asignan a miles de hilos de GPU - Qué significan los tamaños de bloque e hilo - Por qué la divergencia de warp es importante para el rendimiento