Większość platform inferencyjnych nie została stworzona z myślą o niestandardowych modelach. Dedykowana Inference Container jest. Orkiestracja na poziomie zadań, kontrola ruchu oparta na politykach i ręczna optymalizacja rdzeni. Klienci zauważyli 1,4x–2,6x szybszą inferencję w generowaniu wideo w produkcji.