Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Část, kterou většina lidí přeskočí: NVIDIA právě udělala z každého hlasového AI API komoditu.
OpenAI účtuje vstup 0,06 $/min a výstup 0,24 $/min za Realtime API. Gemini Live účtuje 25 tokenů za sekundu zvuku. Každý startup, který vytváří hlasové agenty, ztrácí peníze na poplatcích za minutu na provoz toho, co je v zásadě problém pipeline: ASR → LLM → TTS, tři modely spojené s latencí na každém švu.
PersonaPlex nahrazuje celý tento pipeline jedním modelem 7B. Jezdí na jedné A100. Otevřené váhy, licence MIT, povolené komerční využití. Latence odezvy: 0,170 sekundy pro střídání, 0,240 sekundy pro přerušení.
Dosahuje vyšších skóre v přirozenosti dialogu než Gemini (2,95 vs 2,80 MOS) a lépe zvládá přerušení než všechny komerční systémy, které testovali.
To vám říká vše o NVIDIAině playbooku. Za model si nemusí účtovat. Potřebují, abyste si koupili GPU. Každá firma, která si sama hostuje PersonaPlex místo toho, aby platila OpenAI za minutu, je další prodej A100/H100. Každý startup hlasového agenta, který zruší závislost na API, je další podniková GPU smlouva.
NVIDIA otevřela zdrojový kód rybářského prutu, protože prodává jezero. Postaveno na architektuře Moshi z Kyutai, doladěné s méně než 5 000 hodinami dat.
Hlasová AI margina migruje z aplikační vrstvy na hardwarovou vrstvu. A NVIDIA je jediná společnost, která vydělává bez ohledu na to, který model vyhraje.
330 000 stažení za první měsíc. To je zachycení infrastruktury maskované jako štědrost.
Top
Hodnocení
Oblíbené
