Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Прорыв: Игровая теоретическая обрезка уменьшает размер нейронной сети до 90% с почти нулевыми потерями точности: открытие революции Edge AI!
Я сейчас тестирую это на локальном ИИ, и это потрясающе!
введена обрезка как игра.
Сбалансированная разреженность нейронных сетей — новый подход, который рассматривает обрезку параметров как стратегическую конкуренцию между весами. Этот метод динамически определяет и удаляет избыточные соединения через игровое теоретическое равновесие, достигая огромного сжатия при сохранении — а иногда даже улучшении — производительности модели.
Опубликовано на arXiv всего несколько дней назад (декабрь 2025 года), статья демонстрирует потрясающие результаты: уровень разреженности превышает 90% в крупномасштабных моделях с падением точности менее 1% на таких бенчмарках, как ImageNet и CIFAR-10. Для гигантов с миллиардами параметров это приводит к резкому сокращению объема памяти (до 10 раз меньше), скорости вывода (в 2-5 раз быстрее на стандартном оборудовании) и потребления энергии — все это без головной боли повторного обучения традиционных методов.
Почему это меняет все
Традиционные методы обрезки — такие как обрезка на основе величины или градиента — часто сталкиваются с "сожалением об обрезке", когда агрессивное сжатие ухудшает производительность, заставляя проходить дорогостоящие циклы тонкой настройки. Но эта новая структура, основанная на равновесии, переворачивает сценарий: параметры "соперничают" в кооперативной или неконкурентной игре, где равновесие, подобное Нэшу, выявляет действительно неважные веса.
Результат?
Более чистая, более стабильная разреженность, которая превосходит современные эталоны в трансформерах для зрения, свёрточных сетях и даже в новых мультимодальных архитектурах.
Ключевые моменты из экспериментов:
•90-95% разреженности на ResNet-50 с потерей точности top-1 <0.5% (по сравнению с 2-5% в предыдущих SOTA).
•До 4x быстрее вывод на мобильных GPU, что делает модели с миллиардами параметров жизнеспособными для смартфонов и IoT-устройств.
•Превосходная устойчивость: разреженные модели сохраняют производительность при изменениях распределения и атаке противника лучше, чем плотные аналоги.
Это не просто инкрементально — это сдвиг парадигмы. Представьте, что вы запускаете reasoning масштаба GPT на своем телефоне, анализируете видео в реальном времени на дронах или проводите диагностику в области здравоохранения на краевых устройствах без зависимости от облака.
Сокращая экологический след массового обучения и вывода, это также решает растущий энергетический кризис ИИ.
...

Топ
Рейтинг
Избранное
