Luminal kết hợp toàn bộ mô hình thành một kernel GPU duy nhất, một cách tự động. Hãy cùng nói về lý do tại sao điều này quan trọng cho việc suy diễn với tốc độ ánh sáng: