Se osa, jonka useimmat jättävät väliin: NVIDIA teki jokaisesta puhe-AI-API:sta hyödykkeen. OpenAI veloittaa 0,06 dollaria/min tuloa ja 0,24 dollaria/minuuta reaaliaikaisesta API:sta. Gemini Live veloittaa 25 tokenia sekunnissa ääntä. Jokainen startup, joka rakentaa ääniagentteja, tuhlaa rahaa minuuttikohtaisiin API-maksuihin hoitaakseen perusongelmaa: ASR → LLM → TTS, kolme mallia, jotka on yhdistetty viiveellä jokaisessa saumassa. PersonaPlex korvaa koko putkiston yhdellä 7B-mallilla. Kulkee yhdellä A100:lla. Avoimet painot, MIT-lisenssi, kaupallinen käyttö sallittu. Vastausviive: 0,170 sekuntia vuorotellen, 0,240 sekuntia keskeytyksille. Se saa paremmat pisteet dialogin luonnollisuudessa kuin Gemini (2,95 vs 2,80 MOS) ja käsittelee keskeytyksiä paremmin kuin mikään heidän benchmarkiimansa kaupallinen järjestelmä. Tämä kertoo kaiken NVIDIA:n pelikirjasta. Heidän ei tarvitse veloittaa mallista. He tarvitsevat sinun ostamaan näytönohjaimen. Jokainen yritys, joka isännöi PersonaPlexiä itse sen sijaan, että maksaisi OpenAI:lle minuuttipalkkaa, on toinen A100/H100-myynti. Jokainen ääniagentti-käynnistys, joka luopuu API-riippuvuudestaan, on toinen yrityksen GPU-sopimus. NVIDIA avasi onkivavan avoimen lähdekoodin, koska he myyvät järveä. Rakennettu Kyutain Moshi-arkkitehtuurin pohjalta, hienosäädetty alle 5 000 tunnin datalla. Puhe-AI-marginaali siirtyy sovelluskerrokselta laitteistokerrokselle. Ja NVIDIA on ainoa yritys, joka hyötyy riippumatta siitä, mikä malli voittaa. 330 000 latausta ensimmäisen kuukauden aikana. Se on infrastruktuurin valtaamista, joka on naamioitu anteliaisuudeksi.