Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Прорив: Ігрове обрізання зменшує розмір нейронної мережі до 90% з майже нульовою втратою точності: Розблокування революції ШІ на краях!
Зараз я тестую це на локальному ШІ, і це вражає!
представили Pruning як гру.
Рівноважне розпарування нейронних мереж — новий підхід, який розглядає обрізання параметрів як стратегічну конкуренцію між вагами. Цей метод динамічно ідентифікує та усуває надлишкові зв'язки через ігрову рівновагу, досягаючи значного стиснення при збереженні — а іноді й покращуючи — продуктивність моделі.
Опублікована на arXiv кілька днів тому (грудень 2025), стаття демонструє вражаючі результати: рівні розрідженості перевищують 90% у великих моделях із падіннями точності менш ніж на 1% на бенчмарках, таких як ImageNet і CIFAR-10. Для мільярдних гігантів це означає різке скорочення пам'яті (до 10 разів менше), швидкості висновку (у 2-5 разів швидше на стандартному обладнанні) та енергоспоживання — і все це без проблем із перепідготовкою, як у традиційних методах.
Чому це змінює все
Традиційні методи обрізки — такі як видалення на основі величини або градієнтного видалення — часто стикаються з «жалем на обрізку», коли агресивне стиснення знижує продуктивність, змушуючи дорого налаштовувати процеси тонкого налаштування. Але ця нова рамка, керована рівновагою, змінює ситуацію: параметри «конкурують» у кооперативній або некооперативній грі, де рівновага, схожа на Неша, виявляє справді неважливі ваги.
Результат?
Чистіша, більш стабільна розрідженість, яка перевершує найсучасніші базові стандарти для трансформерів зору, згорткових мереж і навіть нових мультимодальних архітектур.
Основні моменти експериментів:
•90-95% рідкості на ResNet-50 з втратою точності топ-1 <0,5% (проти 2-5% у попередньому SOTA).
• До 4 разів швидше виведення на мобільних GPU, що робить моделі з мільярдом параметрів життєздатними для смартфонів і IoT-пристроїв.
• Вища надійність: Розріджені моделі краще підтримують продуктивність під час зсув розподілу та суперницьких атак, ніж щільні аналоги.
Це не просто поступове — це зміна парадигми. Уявіть собі, що ви запускаєте логіку в масштабі GPT на телефоні, відеоаналіз у реальному часі на дронах або діагностику охорони здоров'я на периферії без залежності від хмари.
Зменшуючи екологічний слід масштабного навчання та висновків, він також безпосередньо долає зростаючу енергетичну кризу ШІ.
...

Найкращі
Рейтинг
Вибране
