Дуже рекомендую туторіал: Вступ до програмування CUDA для розробників Python. Обкладинки: - Як ядра відображаються на тисячі потоків GPU - Що означають розміри блоків і різьби - Чому варп-дивергенція має значення для продуктивності