Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Iemand heeft net de Neural Engine van Apple omzeild om modellen te trainen.
De Neural Engine in elke M-serie Mac is ontworpen voor inferentie.
Voer modellen uit, train ze niet. Geen openbare API, geen documentatie, en zeker geen backpropagation.
Een onderzoeker heeft de privé-API's toch omgekeerd en een transformer-trainingslus gebouwd die vooruit- en achteruitgangen direct op de ANE-hardware uitvoert.
De methode omzeilt CoreML volledig.
In plaats van de officiële tools van Apple te gebruiken, construeert het project programma's in MIL (Model Intermediate Language), compileert ze in het geheugen met behulp van niet gedocumenteerde `_ANEClient` API's, en voedt gegevens via IOSurface gedeelde geheugenbuffers.
Gewichten worden als constanten in de gecompileerde programma's gebakken. E
Elke trainingsstap dispatcht zes aangepaste kernels: aandacht vooruit, feedforward vooruit, en dan vier achteruitgangen die gradiënten met betrekking tot invoer berekenen.
Gewichtgradiënten draaien nog steeds op de CPU met behulp van de matrixbibliotheken van Accelerate, maar het zware werk (matrixvermenigvuldigingen, softmax, activatiefuncties) gebeurt op de ANE.
Dit maakt drie dingen mogelijk die daarvoor niet konden:
1. Het lokaal trainen van kleine modellen zonder je batterij leeg te trekken
2. Fijn afstemmen op het apparaat zonder gegevens naar een server te sturen of de GPU op te starten
3. Onderzoek naar wat de ANE-hardware daadwerkelijk kan doen wanneer je de beveiligingsmaatregelen van Apple negeert
Als deze aanpak opschaalt, stopt de volgende golf van on-device AI met het draaien van iemands bevroren model.
Boven
Positie
Favorieten
