Прорив: Ігрове обрізання зменшує розмір нейронної мережі до 90% з майже нульовою втратою точності: Розблокування революції ШІ на краях! Зараз я тестую це на локальному ШІ, і це вражає! представили Pruning як гру. Рівноважне розпарування нейронних мереж — новий підхід, який розглядає обрізання параметрів як стратегічну конкуренцію між вагами. Цей метод динамічно ідентифікує та усуває надлишкові зв'язки через ігрову рівновагу, досягаючи значного стиснення при збереженні — а іноді й покращуючи — продуктивність моделі. Опублікована на arXiv кілька днів тому (грудень 2025), стаття демонструє вражаючі результати: рівні розрідженості перевищують 90% у великих моделях із падіннями точності менш ніж на 1% на бенчмарках, таких як ImageNet і CIFAR-10. Для мільярдних гігантів це означає різке скорочення пам'яті (до 10 разів менше), швидкості висновку (у 2-5 разів швидше на стандартному обладнанні) та енергоспоживання — і все це без проблем із перепідготовкою, як у традиційних методах. Чому це змінює все Традиційні методи обрізки — такі як видалення на основі величини або градієнтного видалення — часто стикаються з «жалем на обрізку», коли агресивне стиснення знижує продуктивність, змушуючи дорого налаштовувати процеси тонкого налаштування. Але ця нова рамка, керована рівновагою, змінює ситуацію: параметри «конкурують» у кооперативній або некооперативній грі, де рівновага, схожа на Неша, виявляє справді неважливі ваги. Результат? Чистіша, більш стабільна розрідженість, яка перевершує найсучасніші базові стандарти для трансформерів зору, згорткових мереж і навіть нових мультимодальних архітектур. Основні моменти експериментів: •90-95% рідкості на ResNet-50 з втратою точності топ-1 <0,5% (проти 2-5% у попередньому SOTA). • До 4 разів швидше виведення на мобільних GPU, що робить моделі з мільярдом параметрів життєздатними для смартфонів і IoT-пристроїв. • Вища надійність: Розріджені моделі краще підтримують продуктивність під час зсув розподілу та суперницьких атак, ніж щільні аналоги. Це не просто поступове — це зміна парадигми. Уявіть собі, що ви запускаєте логіку в масштабі GPT на телефоні, відеоаналіз у реальному часі на дронах або діагностику охорони здоров'я на периферії без залежності від хмари. Зменшуючи екологічний слід масштабного навчання та висновків, він також безпосередньо долає зростаючу енергетичну кризу ШІ. ...