AI možná nakonec nepotřebuje masivní tréninková data | Hannah Robbins, Johns Hopkins University Shrnutí: Nový výzkum ukazuje, že AI nepotřebuje nekonečné tréninkové daty, aby začala fungovat více jako lidský mozek. Když výzkumníci přepracovali AI systémy tak, aby lépe připomínaly biologické mozky, některé modely produkovaly mozkovou aktivitu bez jakéhokoliv tréninku. To zpochybňuje dnešní přístup k vývoji AI zaměřený na data. Práce naznačuje, že chytřejší návrh by mohl dramaticky urychlit učení a zároveň výrazně snížit náklady a spotřebu energie. --- Nový výzkum z Johns Hopkins University ukazuje, že systémy umělé inteligence postavené na designu inspirovaném biologií mohou začít připomínat lidskou mozkovou aktivitu ještě předtím, než jsou trénovány na jakýchkoli datech. Studie naznačuje, že struktura AI může být stejně důležitá jako množství dat, která zpracovává. Zjištění, publikovaná v časopise Nature Machine Intelligence, zpochybňují dominantní strategii ve vývoji AI. Místo spoléhání se na měsíce školení, obrovské datové sady a obrovský výpočetní výkon výzkum zdůrazňuje hodnotu začít s architektonickým základem podobným mozku. Nové přehodnocení přístupu zaměřeného na data k AI "Způsob, jakým se AI pole teď vyvíjí, je házení hromady dat na modely a budování výpočetních zdrojů velikosti malých měst. To vyžaduje utratit stovky miliard dolarů. Mezitím se lidé učí vidět pomocí velmi malého množství dat," řekl hlavní autor Mick Bonner, docent kognitivních věd na Johns Hopkins University. "Evoluce se možná k tomuto návrhu sbíhala z dobrého důvodu. Naše práce naznačuje, že architektonické návrhy, které jsou více mozkové, staví AI systémy do velmi výhodného výchozího bodu." Bonner a jeho kolegové si kladli za cíl otestovat, zda samotná architektura může AI systémům poskytnout lidsky podobný výchozí bod, aniž by se spoléhali na rozsáhlé školení. Porovnávání populárních AI architektur Výzkumný tým se zaměřil na tři hlavní typy návrhů neuronových sítí běžně používaných v moderních AI systémech: transformátory, plně propojené sítě a konvoluční neuronové sítě. Tyto návrhy opakovaně upravovali a vytvářeli desítky různých umělých neuronových sítí. Žádný z modelů nebyl předem trénován. Výzkumníci pak netrénovaným systémům ukázali snímky objektů, lidí a zvířat a porovnali jejich vnitřní aktivitu s mozkovými reakcemi lidí a ne-lidských primátů, kteří sledovali stejné snímky. Proč konvoluční sítě vynikly Zvýšení počtu umělých neuronů v transformátorech a plně propojených sítích přineslo jen málo významných změn. Podobné úpravy konvolučních neuronových sítí však vedly k vzorcům aktivity, které se více podobaly těm, které byly pozorovány v lidském mozku. Podle výzkumníků tyto netrénované konvoluční modely fungovaly na úrovni tradičních AI systémů, které obvykle vyžadují expozici milionům nebo dokonce miliardám snímků. Výsledky naznačují, že architektura hraje větší roli při formování chování podobného mozku, než se dříve předpokládalo. Rychlejší cesta k chytřejší AI ...