DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Joku ohitti juuri Applen Neural Enginen kouluttaakseen malleja. Jokaisen M-sarjan Macin Neural Engine oli suunniteltu päättelyä varten. Käytä malleja, älä kouluta niitä. Ei julkista API:ta, ei dokumentaatiota, eikä missään nimessä takaiskua. Tutkija käänteisesti suunnitteli yksityiset rajapinnat joka tapauksessa ja rakensi muuntajien koulutussilmukan, joka kulkee suoraan ANE-laitteistolla eteen- ja taaksepäin. Menetelmä ohittaa CoreML:n kokonaan. Applen virallisten työkalujen sijaan projekti rakentaa ohjelmia MIL:llä (Model Intermediate Language), kääntää ne muistissa dokumentoimattomien '_ANEClient'-rajapintojen avulla ja syöttää dataa IOSurfacen jaettujen muistipuskurien kautta. Painot sisällytetään käännettyihin ohjelmiin vakioina. E ACH Training Step lähettää kuusi räätälöityä ydintä: huomio eteenpäin, eteenpäin ja sitten neljä taaksepäin kulkua, jotka laskevat gradientit syötteiden suhteen. Painogradientit toimivat edelleen prosessorilla Accelerate-matriisikirjastojen avulla, mutta raskaat työt (matriisin kertolaskut, softmax, aktivointifunktiot) tapahtuu ANE:lla. Tämä mahdollistaa kolme asiaa, joita ei aiemmin ollut: 1. Kouluta pieniä malleja paikallisesti ilman, että akku kuluu 2. Hienosäätö laitteella ilman, että dataa lähetetään palvelimelle tai GPU:ta käynnistetään 3. Tutki, mitä ANE-laitteisto oikeasti pystyy tekemään, kun Applen suojakaiteet sivuutetaan Jos tämä lähestymistapa skaalautuu, seuraava aalto laitteella tapahtuvaa tekoälyä lakkaa olemaan jonkun toisen jäädytetyn mallin ajamista.

Johtavat

Rankkaus

Suosikit