Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Современный ИИ основан на искусственных нейронных сетях (ИНС). Кто их изобрел?
Биологические нейронные сети были открыты в 1880-х годах [CAJ88-06]. Термин "нейрон" был введен в 1891 году [CAJ06]. Многие считают, что ИНС были разработаны ПОЗЖЕ. Но это не так: первые "современные" ИНС с 2 слоями единиц были изобретены более 2 веков назад (1795-1805) Легандром (1805) и Гауссом (1795, неопубликовано) [STI81], когда вычисления стоили в миллиарды раз дороже, чем в 2025 году.
Верно, терминология искусственных нейронных сетей была введена только гораздо позже, в 1900-х годах. Например, определенные не обучающие ИНС обсуждались в 1943 году [MC43]. Неформальные мысли о простой правилах обучения ИНС были опубликованы в 1948 году [HEB48]. Эволюционные вычисления для ИНС были упомянуты в неопубликованном отчете 1948 года [TUR1]. Различные конкретные обучающие ИНС были опубликованы в 1958 [R58], 1961 [R61][ST61-95] и 1962 [WID62].
Однако, хотя эти статьи об ИНС середины 1900-х годов представляют исторический интерес, ОНИ НА САМОМ ДЕЛЕ ИМЕЮТ МЕНЬШЕ ОТНОШЕНИЕ К СОВРЕМЕННОМУ ИИ, ЧЕМ МНОГОСТАРАЯ АДАПТИВНАЯ ИНС Легандра и Гаусса, которая до сих пор активно используется, являясь самой основой всех ИНС, включая недавние более глубокие ИНС [DL25].
ИНС Гаусса-Легандра, созданная более 2 веков назад [NN25], имеет входной слой с несколькими входными единицами и выходной слой. Для простоты предположим, что последний состоит из одной выходной единицы. Каждая входная единица может хранить число с действительным значением и соединена с выходной единицей соединением с весом, имеющим действительное значение. Выход ИНС — это сумма произведений входов и их весов. Учитывая обучающую выборку входных векторов и желаемых целевых значений для каждого из них, веса ИНС настраиваются так, чтобы сумма квадратов ошибок между выходами ИНС и соответствующими целями была минимизирована [DLH]. Теперь ИНС можно использовать для обработки ранее невидимых тестовых данных.
Конечно, тогда это не называлось ИНС, потому что люди даже не знали о биологических нейронах — первое микроскопическое изображение нервной клетки было создано десятилетиями позже Валентином в 1836 году, а термин "нейрон" был введен Вальдейером в 1891 году [CAJ06]. Вместо этого техника называлась методом наименьших квадратов, также широко известным в статистике как линейная регрессия. Но она МАТЕМАТИЧЕСКИ ИДЕНТИЧНА сегодняшним линейным 2-слойным ИНС: ОДИН И ТОТ ЖЕ базовый алгоритм, ОДИН И ТОТ ЖЕ функционал ошибки, ОДИН И ТОТ ЖЕ адаптивные параметры/веса. Такие простые ИНС выполняют "поверхностное обучение", в отличие от "глубокого обучения" с множеством нелинейных слоев [DL25]. На самом деле, многие современные курсы по ИНС начинают с введения в этот метод, а затем переходят к более сложным, глубоким ИНС [DLH].
Даже приложения начала 1800-х годов были похожи на сегодняшние: учиться предсказывать следующий элемент последовательности, учитывая предыдущие элементы. ЭТО И ЕСТЬ ТО, ЧТО ДЕЛАЕТ CHATGPT! Первый известный пример распознавания образов с помощью ИНС восходит более чем на 200 лет назад: повторное открытие карликовой планеты Церера в 1801 году Гауссом, который собрал шумные данные из предыдущих астрономических наблюдений, а затем использовал их для настройки параметров предсказателя, который по сути научился обобщать на основе обучающих данных, чтобы правильно предсказать новое местоположение Цереры. Это сделало молодого Гаусса знаменитым [DLH].
Старые ИНС Гаусса-Легандра до сих пор используются сегодня в бесчисленных приложениях. В чем основное отличие от ИНС, используемых в некоторых впечатляющих приложениях ИИ с 2010-х годов? Последние, как правило, гораздо глубже и имеют много промежуточных слоев "скрытых" единиц обучения. Кто это изобрел? Краткий ответ: Ивахненко и Лапа (1965) [DEEP1-2]. Другие уточнили это [DLH]. Смотрите также: кто изобрел глубокое обучение [DL25]?
Некоторые люди все еще верят, что современные ИНС были как-то вдохновлены биологическим мозгом. Но это просто не так: за десятилетия до открытия биологических нервных клеток простое инженерное и математическое решение уже привело к тому, что сейчас называется ИНС. На самом деле, за последние 2 века в исследованиях ИИ не так много изменилось: по состоянию на 2025 год, прогресс ИНС по-прежнему в основном движется инженерией, а не нейрофизиологическими инсайтами. (Некоторые исключения, относящиеся к многим десятилетиям назад [CN25], подтверждают правило.)
Сноска 1. В 1958 году простые ИНС в стиле Гаусса и Легандра были объединены с функцией порога выхода, чтобы получить классификаторы образов, называемые перцептронами [R58][R61][DLH]. Удивительно, что авторы [R58][R61] казались неосведомленными о гораздо более ранней ИНС (1795-1805), известной в области статистики как "метод наименьших квадратов" или "линейная регрессия." Удивительно, что самые часто используемые сегодня 2-слойные ИНС — это ИНС Гаусса и Легандра, а не ИНС 1940-х годов [MC43] и 1950-х годов [R58] (которые даже не были дифференцируемыми)!
ИЗБРАННЫЕ ССЫЛКИ (много дополнительных ссылок в [NN25] - см. ссылку выше):
[CAJ88] С. Р. Кахаль. Структура нервных центров птиц. Rev. Trim. Histol. Norm. Patol., 1 (1888), стр. 1-10.
[CAJ88b] С. Р. Кахаль. О нервных волокнах молекулярного слоя мозжечка. Rev. Trim. Histol. Norm. Patol., 1 (1888), стр. 33-49.
[CAJ89] Общая связь нервных элементов. Med. Práct., 2 (1889), стр. 341-346.
[CAJ06] Ф. Лопес-Муньос, Дж. Боя б, К. Аламо (2006). Теория нейронов, краеугольный камень нейронауки, к столетию присуждения Нобелевской премии Сантьяго Рамону и Кахалю. Brain Research Bulletin, Том 70, Выпуски 4–6, 16 октября 2006 года, стр. 391-405.
...

Топ
Рейтинг
Избранное

