Am câteva rețineri cu API-ul OpenAI: Pentru un utilizator Linux, poți deja să construiești singur un astfel de sistem destul de simplu, cumpărând o cutie 4xH100, instalând-o acasă, instalând CUDA și vLLM local și rulând GLM, Kimi sau un model open-source comparabil. În cazul sarcinilor tipice ale consumatorilor, ar trebui să te aștepți la un TPS mai mare pentru o fracțiune din cost.