Tutoriel fortement recommandé : Introduction à la programmation CUDA pour les développeurs Python. Couvre : - Comment les noyaux se mappent à des milliers de threads GPU - Ce que signifient les tailles de blocs et de threads - Pourquoi la divergence de warp est importante pour la performance