La gente realmente no entiende qué arma estratégica competitiva se ha convertido el código abierto y cómo funciona. Alfred Marshall estaría orgulloso. Siempre es bueno volver a leer "La catedral y el bazar".
Aakash Gupta
Aakash Gupta16 feb, 02:24
La parte que la mayoría de la gente saltará: NVIDIA acaba de convertir cada API de IA de voz en una mercancía. OpenAI cobra $0.06/minuto de entrada y $0.24/minuto de salida por la API en tiempo real. Gemini Live cobra 25 tokens/segundo de audio. Cada startup que construye agentes de voz está sangrando dinero por las tarifas de API por minuto para ejecutar lo que es fundamentalmente un problema de canalización: ASR → LLM → TTS, tres modelos cosidos juntos con latencia en cada costura. PersonaPlex reemplaza toda esa canalización con un solo modelo de 7B. Funciona en un solo A100. Pesos abiertos, licencia MIT, uso comercial permitido. Latencia de respuesta: 0.170 segundos para turnos, 0.240 segundos para interrupciones. Obtiene una puntuación más alta en naturalidad del diálogo que Gemini (2.95 frente a 2.80 MOS) y maneja las interrupciones mejor que cualquier sistema comercial que evaluaron. Esto te dice todo sobre el libro de jugadas de NVIDIA. No necesitan cobrar por el modelo. Necesitan que compres la GPU. Cada empresa que aloja PersonaPlex en lugar de pagar a OpenAI por minuto es otra venta de A100/H100. Cada startup de agentes de voz que elimina su dependencia de la API es otro contrato de GPU empresarial. NVIDIA ha liberado el anzuelo porque venden el lago. Construido sobre la arquitectura Moshi de Kyutai, ajustado con menos de 5,000 horas de datos. El margen de la IA de voz está migrando de la capa de aplicación a la capa de hardware. Y NVIDIA es la única empresa que obtiene beneficios sin importar qué modelo gane. 330,000 descargas en el primer mes. Eso es captura de infraestructura disfrazada de generosidad.
A largo plazo, el precio marginal tiende a igualarse con el costo marginal. En software, eso es $0.
32