Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Хтось щойно обійшов нейронний двигун Apple, щоб навчити моделі.
Нейронний двигун у кожному Mac серії M був розроблений для інференції.
Запускайте моделей, не тренуйте їх. Немає публічного API, немає документації і, звичайно, немає зворотного поширення.
Один дослідник все ж провів зворотне інжинірування приватних API і створив тренувальний контур трансформатора, який проходить передачі вперед і назад безпосередньо на апаратному забезпеченні ANE.
Метод повністю обходить CoreML.
Замість використання офіційних інструментів Apple проєкт створює програми на MIL (Model Intermediate Language), компілює їх у пам'яті за допомогою незадокументованих API '_ANEClient' та передає дані через буфери спільної пам'яті IOSurface.
Ваги закріплюються в компільованих програмах як константи. E
Крок навчання ACH розподіляє шість власних ядер: Attention Forward, Feedforward Forward, а потім Four Backward Pass, які обчислюють градієнти щодо вхідних даних.
Градієнти ваги все ще працюють на процесорі з використанням матричних бібліотек Accelerate, але основна робота (множення матриці, softmax, функції активації) відбувається на ANE.
Це робить можливими три речі, яких раніше не було:
1. Навчання малих моделей локально без витрати батареї
2. Тонке налаштування пристрою без передачі даних на сервер або запуску GPU
3. Дослідити, що насправді може робити апаратне забезпечення ANE, якщо ігнорувати захисні бар'єри Apple
Якщо такий підхід масштабується, наступна хвиля штучного інтелекту на пристрої перестане бути про запуск чужої замороженої моделі.
Найкращі
Рейтинг
Вибране
