DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Het deel dat de meeste mensen zullen overslaan: NVIDIA heeft net elke stem AI API tot een commodity gemaakt. OpenAI rekent $0,06/min invoer en $0,24/min uitvoer voor de Realtime API. Gemini Live rekent 25 tokens/seconde audio. Elke startup die stemagenten bouwt, verliest geld aan per-minuut API-kosten om wat fundamenteel een pijplijnprobleem is te runnen: ASR → LLM → TTS, drie modellen aan elkaar genaaid met latentie bij elke naad. PersonaPlex vervangt die hele pijplijn met één 7B-model. Draait op een enkele A100. Open gewichten, MIT-licentie, commercieel gebruik toegestaan. Reactietijd: 0,170 seconden voor beurtwisseling, 0,240 seconden voor onderbrekingen. Het scoort hoger op de natuurlijkheid van dialogen dan Gemini (2,95 vs 2,80 MOS) en gaat beter om met onderbrekingen dan elk commercieel systeem dat ze hebben getest. Dit vertelt je alles over het speelboek van NVIDIA. Ze hoeven niet te rekenen voor het model. Ze hebben je nodig om de GPU te kopen. Elk bedrijf dat PersonaPlex zelf host in plaats van OpenAI per minuut te betalen, is weer een verkoop van een A100/H100. Elke stemagent startup die hun API-afhankelijkheid laat vallen, is een ander enterprise GPU-contract. NVIDIA heeft de hengel open-source gemaakt omdat ze het meer verkopen. Gebouwd op de Moshi-architectuur van Kyutai, fijn afgestemd met minder dan 5.000 uur aan data. De marge van stem AI migreert van de applicatielaag naar de hardwarelaag. En NVIDIA is het enige bedrijf dat winst maakt, ongeacht welk model wint. 330.000 downloads in de eerste maand. Dat is infrastructuurcaptatie vermomd als vrijgevigheid.

Boven

Positie

Favorieten