Luminal fonde interi modelli in un singolo kernel GPU, automaticamente. Parliamo del perché questo sia importante per l'inferenza alla velocità della luce: