Tengo algunas objeciones con la API de OpenAI: Para un usuario de Linux, ya puedes construir un sistema así tú mismo de forma bastante sencilla comprando un decodificador 4xH100, instalándolo en casa, instalando CUDA y vLLM localmente, y ejecutando GLM, Kimi o un modelo de código abierto comparable. Con cargas de trabajo típicas para consumidores, deberías esperar un TPS más alto por una fracción del coste.