Sehr empfehlenswertes Tutorial: Einführung in die CUDA-Programmierung für Python-Entwickler. Behandelt: - Wie Kerne auf Tausende von GPU-Threads abgebildet werden - Was Block- und Thread-Größen bedeuten - Warum Warp-Divergenz für die Leistung wichtig ist