Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Seseorang baru saja melewati Neural Engine Apple untuk melatih model.
Neural Engine di dalam setiap Mac seri M dirancang untuk inferensi.
Jalankan model, jangan latih mereka. Tidak ada API publik, tidak ada dokumentasi, dan tentu saja tidak ada propagasi balik.
Seorang peneliti merekayasa balik API pribadi dan membangun loop pelatihan transformator yang berjalan maju dan mundur langsung pada perangkat keras ANE.
Metode ini melewati CoreML sepenuhnya.
Alih-alih menggunakan alat resmi Apple, proyek ini membangun program dalam MIL (Model Intermediate Language), mengkompilasinya dalam memori menggunakan API '_ANEClient' yang tidak terdokumentasi, dan memberi makan data melalui buffer memori bersama IOSurface.
Bobot dipanggang ke dalam program yang dikompilasi sebagai konstanta. E
Langkah pelatihan ACH mengirimkan enam kernel khusus: perhatian ke depan, umpan ke depan ke depan, lalu empat lintasan mundur yang menghitung gradien sehubungan dengan input.
Gradien berat masih berjalan pada CPU menggunakan pustaka matriks Accelerate, tetapi pengangkatan berat (matriks berlipat ganda, softmax, fungsi aktivasi) terjadi pada ANE.
Ini membuat tiga hal menjadi mungkin yang tidak ada sebelumnya:
1. Melatih model kecil secara lokal tanpa membakar baterai Anda
2. Menyempurnakan pada perangkat tanpa mengirim data ke server atau memutar GPU
3. Teliti apa yang sebenarnya dapat dilakukan perangkat keras ANE ketika Anda mengabaikan pagar pembatas Apple
Jika pendekatan ini berskala, gelombang AI di perangkat berikutnya berhenti tentang menjalankan model beku orang lain.
Teratas
Peringkat
Favorit
