Google on yritys, jolla ei ole pulaa laskentatehosta, eikä häneltä puutu enempää kuin Nvidiasta. Jopa NVIDIA-näytönohjaimet noudattavat todennäköisesti TPU:ta (ympyrän läpikuultava konsensus) 1️⃣ Tensoriydin NVIDIA:n täysi käyttöönotto Voltan jälkeen lähestyy käytännössä TPU:n matriisikertolaskun erikoistumista 2️⃣ Matalan tarkkuuden laskenta (FP16 / BF16 / INT8) TPU optimoitiin alhaiselle tarkkuudelle päättelyä varten varhaisessa vaiheessa, ja GPU "pakotettiin" tukemaan mallin vaatimuksia 3️⃣ Massiivinen klusterointi + kääntäjäyhteistyö TPU on koko "laitteiston × kääntäjän × aikataulutuksen" kokonaisuus, ja NVIDIA on vasta alkanut tehdä vakavasti Triton/CUDA Graph/NVLink -tasoista yhteistyötä Nvidia ansaitsee rahaa sirulaskentateholla, kun taas Google luottaa vakaaseen ekosysteemiin monien vuosien ajan: mainonta, hakukoneet, YouTube, selaimet, Android ja muut verkkoilmiöt verta, ja laskentateho on vain sen kustannus, ei voittojen kulutus. TPU on aina ollut Googlen monipuolinen tutkimus, joka mahdollistaa riittävän pitkän tutkimuksen ja kumoamisen. Jeff Deanin käsitys TPU:sta on, että jos mallin määrittelee sinä, myös laitteiston tulisi määritellä sinä, joten TPU on täydellinen joukko järjestelmätekniikkaa kääntäjästä (XLA), laskennallisesta graafista (TensorFlow), datakeskustopologiasta ja aikataulutusjärjestelmästä Riskin osalta, koska NVIDIA myy GPU:ita, sen on palveltava kaikkia asiakkaita, ja viansietokyky on erittäin alhainen. Mikä Yhdysvaltojen osake ostaa, on taas selvä