De fleste inferensplattformer var ikke bygget for tilpassede modeller. Dedikert container-inferens er det. Jobbnivåorkestrering, policystyrt trafikkkontroll og praktisk kjerneoptimalisering. Kundene så 1,4–2,6 ganger raskere slutning på videogenerering i produksjon.