Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Jakso 1: Nvidia "hankkii" Groqin
@vikramskr ja @theaustinlyons
Keskeiset opitukset:
- GPU:t eivät ole kuolleita. HBM ei ole kuollut.
- LPU:t ratkaisevat toisen ongelman: deterministisen, erittäin matalaviiveisen päättelyn pienille malleille.
- Suuret rajamallit vaativat edelleen HBM-pohjaisia järjestelmiä.
- Nvidian siirto laajentaa päättelyportfolion pinta-alaa sen sijaan, että korvaisi GPU:ita.
- Tekoälyinfrastruktuurin tulevaisuus on työkuormakohtainen optimointi ja TCO-ohjattu käyttöönotto.
Keskeiset aiheet:
- Mitä Nvidia oikeastaan osti Groqilta ja miksi se ei ole perinteinen yritysosto
- Miksi kauppa laukaisi väitteet, että GPU:t ja HBM ovat vanhentuneita
- Arkkitehtoniset kompromissit GPU:iden, TPU:jen, XPU:iden ja LPU:iden välillä
- SRAM vs HBM. Nopeus, kapasiteetti, kustannukset ja toimitusketjun realiteetit
- Groq LPU:n perusteet: VLIW, kääntäjän aikataulutettu suoritus, determinismi, erittäin matala viive
- Miksi LPU:t kamppailevat suurten mallien kanssa ja missä ne sen sijaan menestyvät
- Käytännölliset käyttötapaukset hypermatalan viiveen päättelyyn:
-- Mainostekstin personointi hakuviivebudjeetteilla
-- Mallin reititys ja agenttien orkestrointi
-- Keskustelukäyttöliittymät ja reaaliaikainen käännös
-- Robotiikka ja fyysinen tekoäly reunalla
-- Mahdolliset sovellukset AI-RAN- ja televiestintäinfrastruktuurissa
- Muisti suunnitteluspektrinä: pelkkä SRAM, SRAM plus DDR, SRAM plus HBM
- Nvidian kasvava lähestymistapa päättelylaitteistoon yhden koon sijaan
Johtavat
Rankkaus
Suosikit
