Luminal fusionne des modèles entiers en un seul noyau GPU, automatiquement. Parlons de l'importance de cela pour l'inférence à la vitesse de la lumière :