Partea pe care majoritatea oamenilor o vor sări: NVIDIA pur și simplu a transformat fiecare API AI vocal într-o marfă. OpenAI percepe 0,06 dolari/min la intrare și 0,24 dolari/min la ieșire pentru API-ul în timp real. Gemini Live facturează 25 de jetoane pe secundă de audio. Fiecare startup care construiește agenți vocali pierde bani pe comisioane API pe minut pentru a rula ceea ce este fundamental o problemă de pipeline: ASR → LLM → TTS, trei modele cusute împreună cu latență la fiecare fir. PersonaPlex înlocuiește întregul pipeline cu un singur model 7B. Funcționează pe un singur A100. Greutăți deschise, licență MIT, utilizare comercială permisă. Latența răspunsului: 0,170 secunde pentru efectuarea turului, 0,240 secunde pentru întreruperi. Are un scor mai mare la naturalitatea dialogului decât Gemini (2,95 față de 2,80 MOS) și gestionează întreruperile mai bine decât orice sistem comercial pe care l-au evaluat. Acest lucru îți spune totul despre playbook-ul NVIDIA. Nu trebuie să taxeze pentru model. Au nevoie să cumperi placa video. Fiecare companie care găzduiește singur PersonaPlex în loc să plătească OpenAI pe minut este o altă vânzare A100/H100. Fiecare startup de agent vocal care renunță la dependența de API este un alt contract GPU enterprise. NVIDIA a făcut open source lansetei pentru că vând lacul. Construit pe arhitectura Moshi de la Kyutai, ajustat fin cu sub 5.000 de ore de date. Marja AI vocală migrează de la stratul aplicației la cel hardware. Iar NVIDIA este singura companie care profită indiferent de modelul câștigător. 330.000 de descărcări în prima lună. Aceasta este capturarea infrastructurii deghizată în generozitate.