Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Joku ohitti juuri Applen Neural Enginen kouluttaakseen malleja.
Jokaisen M-sarjan Macin Neural Engine oli suunniteltu päättelyä varten.
Käytä malleja, älä kouluta niitä. Ei julkista API:ta, ei dokumentaatiota, eikä missään nimessä takaiskua.
Tutkija käänteisesti suunnitteli yksityiset rajapinnat joka tapauksessa ja rakensi muuntajien koulutussilmukan, joka kulkee suoraan ANE-laitteistolla eteen- ja taaksepäin.
Menetelmä ohittaa CoreML:n kokonaan.
Applen virallisten työkalujen sijaan projekti rakentaa ohjelmia MIL:llä (Model Intermediate Language), kääntää ne muistissa dokumentoimattomien '_ANEClient'-rajapintojen avulla ja syöttää dataa IOSurfacen jaettujen muistipuskurien kautta.
Painot sisällytetään käännettyihin ohjelmiin vakioina. E
ACH Training Step lähettää kuusi räätälöityä ydintä: huomio eteenpäin, eteenpäin ja sitten neljä taaksepäin kulkua, jotka laskevat gradientit syötteiden suhteen.
Painogradientit toimivat edelleen prosessorilla Accelerate-matriisikirjastojen avulla, mutta raskaat työt (matriisin kertolaskut, softmax, aktivointifunktiot) tapahtuu ANE:lla.
Tämä mahdollistaa kolme asiaa, joita ei aiemmin ollut:
1. Kouluta pieniä malleja paikallisesti ilman, että akku kuluu
2. Hienosäätö laitteella ilman, että dataa lähetetään palvelimelle tai GPU:ta käynnistetään
3. Tutki, mitä ANE-laitteisto oikeasti pystyy tekemään, kun Applen suojakaiteet sivuutetaan
Jos tämä lähestymistapa skaalautuu, seuraava aalto laitteella tapahtuvaa tekoälyä lakkaa olemaan jonkun toisen jäädytetyn mallin ajamista.
Johtavat
Rankkaus
Suosikit
