Sono entusiasta di annunciare l'inferenza con contenitori dedicati - uno dei prodotti che ero così emozionato di costruire quando sono entrato in @togethercompute e ora, sei mesi dopo, siamo attivi! Un grande applauso al team - questo rende facile eseguire l'inferenza per modelli ad alta intensità di calcolo come video, audio e generazione di avatar con primitive per l'auto-scaling, la gestione delle code, le priorità, le metriche, il logging e altro ancora. Se stai costruendo in questo settore, mi piacerebbe sentirti!