Někdo právě obešel Apple Neural Engine a trénoval modely. Neural Engine v každém Macu řady M byl navržen pro inferenci. Spouštějte modely, netrénujte je. Žádné veřejné API, žádná dokumentace a rozhodně žádná zpětná propagace. Výzkumník přesto reverzně analyzoval soukromá API a vytvořil transformátorovou tréninkovou smyčku, která běží přímo na hardwaru ANE vpřed a zpět. Metoda CoreML zcela obchází. Místo použití oficiálních nástrojů Apple projekt vytváří programy v MIL (Model Intermediate Language), kompiluje je v paměti pomocí nedokumentovaných API '_ANEClient' a předává data přes sdílené paměťové buffery IOSurface. Váhy jsou do kompilovaných programů započítány jako konstanty. E TRÉNOVACÍ krok ACH vysílá šest vlastních jader: pozornost vpřed, feedforward forward, poté čtyři zpětné průchody, které počítají gradienty vzhledem k vstupům. Váhové gradienty stále běží na CPU pomocí maticových knihoven Accelerate, ale těžší práce (maticové násobení, softmax, aktivační funkce) probíhá na ANE. To umožňuje tří věci, které dříve nebyly: 1. Trénování malých modelů lokálně bez vyčerpání baterie 2. Jemné ladění přímo na zařízení bez odesílání dat na server nebo spuštění GPU 3. Zjistěte, co hardware ANE skutečně dokáže, když ignorujete omezení Applu Pokud se tento přístup rozšíří, další vlna AI na zařízení přestane být o spouštění cizího zmrazeného modelu.