Sebagian besar platform inferensi tidak dibuat untuk model khusus. Inferensi Kontainer Khusus adalah. Orkestrasi tingkat pekerjaan, kontrol lalu lintas berbasis kebijakan, dan pengoptimalan kernel langsung. Pelanggan melihat inferensi 1,4x–2,6x lebih cepat pada pembuatan video dalam produksi.