Luminal łączy całe modele w jeden rdzeń GPU, automatycznie. Porozmawiajmy o tym, dlaczego to ma znaczenie dla wnioskowania z prędkością światła: