Ich freue mich, die dedizierte Container-Inferenz anzukündigen - eines der Produkte, auf die ich so gespannt war, als ich @togethercompute beigetreten bin, und jetzt, 6 Monate später, sind wir live! Großes Lob an das Team - das macht es einfach, Inferenz für rechenintensive Modelle wie Video-, Audio- und Avatar-Generierung mit Primitiven für automatisches Skalieren, Warteschlangen, Prioritäten, Metriken, Protokollierung und mehr auszuführen. Wenn du in diesem Bereich arbeitest, würde ich gerne von dir hören!