ik ben enthousiast om de dedicated container inference aan te kondigen - een van de producten waar ik zo opgewonden over was om te bouwen toen ik voor het eerst bij @togethercompute kwam en nu, 6 maanden later, zijn we live! grote complimenten aan het team - dit maakt het gemakkelijk om inference uit te voeren voor dichte compute-bound modellen zoals video, audio en avatar generatie met primitives voor auto-scaling, queueing, prioriteiten, metrics, logging en meer. als je in deze ruimte bouwt, zou ik graag van je horen!