Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jürgen Schmidhuber
Vynalezl principy meta-učení (1987), GAN (1990), Transformers (1991), velmi hlubokého učení (1991) atd. Naše umělá inteligence je používána mnoho miliard krát denně.
Fyzická umělá inteligence před 10 lety: dětský robot vynalezl vlastní experimenty, aby vylepšil svůj model neuronového světa
Kompella, Stollenga, Luciw, Schmidhuber. Neustálé získávání dovedností poháněné zvědavostí z vysoce dimenzionálních video vstupů pro humanoidní roboty. Umělá inteligence, 2015

10,54K
Před 1 desetiletím: Inženýr posilovaného učení v kapitole 5.3 článku «Učíme se myslet ...» [2]. Adaptivní myšlenkový řetězec! RL síť se učí dotazovat se jiné sítě pro abstraktní uvažování a rozhodování. Překonává světový model z roku 1990 v plánování milisekundy po milisekundách [1].
[2] J. Schmidhuber (JS, 2015). «O učení se myslet: Algoritmická teorie informace pro nové kombinace RL regulátorů a modelů rekurentního neuronového světa.» ArXiv 1210.0118
[1] JS (1990). "Making the world differentiable (Vytváření diferencovatelnosti): O využití plně rekurentních neuronových sítí pod vlastním dohledem pro dynamické zpětnovazební učení a plánování v nestacionárních prostředích." TR FKI-126-90, TUM. (Tato zpráva také představila umělou zvědavost a vnitřní motivaci prostřednictvím generativních nepřátelských sítí.)

23,37K
Před 10 lety, v květnu 2015, jsme publikovali první funkční velmi hluboké dopředné neuronové sítě (FNN) založené na gradientech se stovkami vrstev (předchozí FNN měly maximálně několik desítek vrstev). K překonání problému mizejícího gradientu využily naše dálniční sítě reziduální spojení, která poprvé zavedla v roce 1991 společnost @HochreiterSepp, aby dosáhla konstantního toku chyb v rekurentních NN (RNN), které jsou řízeny multiplikativními hradly podobnými zápoložným hradlům (Gers et al., 1999) našeho velmi hlubokého LSTM RNN. Dálniční sítě byly umožněny díky práci mých bývalých doktorandů @rupspace a Klause Greffa. Nastavením bran Highway NN na 1.0 získáme ResNet zveřejněný o 7 měsíců později.
Hluboké učení je především o hloubce NN. LSTM přinesly v podstatě neomezenou hloubku opakujícím se NN; Highway Nets to přinesly do dopředných NN.
20,56K
1991: První destilace neuronových sítí [1-3]. Tehdy jsem tomu říkal "kolaps", ne "destilace".
Odkazy
[1] J. Schmidhuber (1991). Neuronové sekvence chunkery. Technická zpráva FKI-148-91, Technická univerzita v Mnichově. Oddíl 3.2.2. Oddíl 4 se týká "kolapsu" nebo "destilace" nebo "komprese" znalostí neuronové sítě do jiné neuronové sítě.
[2] JS (1992). Učení složitých, rozšířených sekvencí pomocí principu komprese historie. Neuronové výpočty, 4(2):234-242, 1992. Na základě [1].
[3] JS (AI Blog, 2021, aktualizováno 2025). 1991: První velmi hluboké učení s předtréninkem bez učitele. První destilace neuronových sítí.

16,05K
Všichni nyní mluví o rekurzivním sebezdokonalování a Gödelových strojích a o tom, jak to povede k AGI. Jaká změna oproti době před 15 lety! Měli jsme AGI'2010 v Luganu a předsedali jsme AGI'2011 ve společnosti Google. Páteří konferencí AGI byla matematicky optimální univerzální AI: Gödelův stroj z roku 2003 (a AIXI z roku @mhutter42 - viz jeho kniha UAI z roku 2005 a její nedávná aktualizace z roku 2024 (Jsem hrdý na to, že práce Marcuse Huttera v AIXI byla financována mým švýcarským grantem SNF z roku 2000, když byl postdoktorandem na IDSIA.

57,02K
AGI? Jednoho dne, ale ještě ne. Jediná umělá inteligence, která v současné době funguje dobře, je ta za obrazovkou [12-17]. Ale projít Turingovým testem [9] za obrazovkou je snadné ve srovnání s reálnou umělou inteligencí pro skutečné roboty v reálném světě. Žádný současný robot řízený umělou inteligencí by nemohl být certifikován jako instalatér [13-17]. Turingův test tedy není dobrým měřítkem inteligence (stejně jako IQ). A AGI bez ovládnutí fyzického světa není AGI. Proto jsem v roce 2004 vytvořil TUM CogBotLab pro učící se roboty [5], v roce 2014 jsem spoluzaložil společnost pro umělou inteligenci ve fyzickém světě [6] a nechal jsem týmy v TUM, IDSIA a nyní KAUST pracovat na dětských robotech [4,10-11,18]. Takoví měkcí roboti nejen otrocky napodobují lidi, ale nefungují tak, že si prostě stáhnou web jako LLM/VLM. Místo toho využívají principy umělé zvědavosti ke zlepšení svých neuronových modelů světa (dva termíny, které jsem použil v roce 1990 [1-4]). Tito roboti pracují se spoustou senzorů, ale pouze se slabými aktuátory, takže si nemohou snadno ublížit [18], když shromažďují užitečná data tím, že vymýšlejí a provádějí experimenty, které si sami vymyslí.
Pozoruhodné je, že od roku 1970 si mnozí dělali legraci z mého starého cíle vybudovat sebezdokonalující se AGI, chytřejší než jsem já, a pak odejít do důchodu. V poslední době to však mnozí konečně začali brát vážně a nyní jsou někteří z nich najednou PŘÍLIŠ optimističtí. Tito lidé si často blaženě neuvědomují zbývající výzvy, které musíme vyřešit, abychom dosáhli skutečné umělé inteligence. Moje přednáška na TEDu v roce 2024 [15] něco z toho shrnuje.
REFERENCE (snadno dostupné na webu):
[1] J. Schmidhuber. Making the world differentiable (Vytváření odlišnosti): O používání plně rekurentních neuronových sítí s vlastním dohledem (NN) pro dynamické zpětnovazební učení a plánování v nestacionárních prostředích. TR FKI-126-90, TUM, únor 1990, revidováno v listopadu 1990. Tento článek také představil umělou zvědavost a vnitřní motivaci prostřednictvím generativních adversariálních sítí, kde generátor NN bojuje s prediktorem NN ve hře minimax.
[2] J. S. Možnost implementace zvědavosti a nudy do neuronových kontrolérů vytvářejících modely. In J. A. Meyer a S. W. Wilson, editoři, Proc. Mezinárodní konference o simulaci adaptivního chování: Od zvířat k animatům, strany 222-227. MIT Press/Bradford Books, 1991. Na základě [1].
[3] Blog J.S. AI (2020). 1990: Plánování a zpětnovazební učení s opakujícími se modely světa a umělou zvědavostí. Shrnutí aspektů [1][2] a spousty pozdějších článků včetně [7][8].
[4] J.S. AI Blog (2021): Umělá zvědavost a kreativita od roku 1990. Shrnutí aspektů [1][2] a spousty pozdějších článků včetně [7][8].
[5] J.S. TU Mnichov CogBotLab pro učící se roboty (2004-2009)
[6] NNAISENSE, založený v roce 2014, pro umělou inteligenci ve fyzickém světě
[7] J. S. (2015). O učení se myslet: Algoritmická teorie informace pro nové kombinace ovladačů zpětnovazebního učení (RL) a modelů opakujícího se neuronového světa. arXiv 1210.0118. Oddíl 5.3 popisuje inženýra RL Prompt, který se učí dotazovat se svého modelu na abstraktní uvažování, plánování a rozhodování. Dnes se tomu říká "myšlenkový řetěz".
[8] J. S. (2018). Jedna velká síť na všechno. arXiv 1802.08864. Viz také patentové US11853886B2 a můj tweet DeepSeek: DeepSeek uses elements of 2015 reinforcement learning prompt engineer [7] a jeho vylepšení z roku 2018 [8], které zhroutí RL stroj a model světa [7] do jediné sítě. To využívá můj postup destilace neuronové sítě z roku 1991: destilovaný řetězec myšlenkového systému.
[9] J.S. Turing přeprodaný. Není to však Turingova chyba. AI Blog (2021, byl #1 na Hacker News)
[10] J.S. Intelligente Roboter werden vom Leben fasziniert sein. (Inteligentní roboti budou fascinováni životem.) F.A.Z., 2015
[11] J. S. v Falling Walls: The Past, Present and Future of Artificial Intelligence. Scientific American, Pozorování, 2017.
[12] J.S. KI ist eine Riesenchance für Deutschland. (Umělá inteligence je pro Německo obrovskou šancí.) F.A.Z., 2018
[13] H. Jones. J.S. říká, že jeho životní dílo nepovede k dystopii. Časopis Forbes, 2023.
[14] Rozhovor s J. S. Jazzyearem, Šanghaj, 2024.
[15] Přednáška J.S. TEDA na konferenci TED AI ve Vídni (2024): Proč bude rok 2042 velkým rokem pro umělou inteligenci. Podívejte se na přiložený videoklip.
[16] J.S. Baut den KI-gesteuerten Allzweckroboter! (Postavte si univerzálního robota ovládaného umělou inteligencí!) F.A.Z., 2024
[17] J.S. 1995-2025: Úpadek Německa a Japonska vs. USA a Číny. Mohou univerzální roboti podpořit návrat? Blog o umělé inteligenci, leden 2025, na základě [16].
[18] M. Alhakami, D. R. Ashley, J. Dunham, Y. Dai, F. Faccio, E. Feron, J. Schmidhuber. Směrem k extrémně robustnímu dětskému robotu s bohatou schopností interakce pro pokročilé algoritmy strojového učení. Preprint arxiv 2404.08093, 2024.
66,82K
DeepSeek [1] používá prvky inženýra 2015 reinforcement learning prompt engineer [2] a jeho vylepšení z roku 2018 [3], který zhroutí RL stroj a model světa [2] do jediné sítě prostřednictvím procedury destilace neuronové sítě z roku 1991 [4]: destilovaného řetězce myšlenkového systému.
REFERENCE (snadno dostupné na webu):
[1] #DeepSeekR1 (2025): Motivace schopnosti uvažování v LLM prostřednictvím zpětnovazebního učení. arXiv 2501.12948
[2] J. Schmidhuber (JS, 2015). O učení se myslet: Algoritmická teorie informace pro nové kombinace ovladačů zpětnovazebního učení a modelů opakujícího se neuronového světa. arXiv 1210.0118. Oddíl 5.3 popisuje inženýra rychlého učení posilováním (RL), který se učí aktivně a iterativně dotazovat svého modelu pro abstraktní uvažování, plánování a rozhodování.
[3] JS (2018). Jedna velká síť na všechno. arXiv 1802.08864. Viz také US11853886B2. Tento článek shrnuje zpětnovazební učení a model světa [2] (např. základní model) do jediné sítě pomocí postupu destilace neuronové sítě z roku 1991 [4]. V podstatě to, co se nyní nazývá RL "Chain of Thought" systém, kde jsou následná vylepšení neustále destilována do jediné sítě. Viz také [5].
[4] JS (1991). Učení složitých, rozšířených sekvencí pomocí principu komprese historie. Neuronové výpočty, 4(2):234-242, 1992. Založeno na TR FKI-148-91, TUM, 1991. První pracující hluboký učící se na základě hluboké opakující se hierarchie neuronových sítí (s různými samoorganizujícími se časovými škálami), překonávající problém mizejícího gradientu pomocí předběžného trénování bez učitele (P v CHatGPT) a prediktivního kódování. Také: komprese nebo destilace učitelské sítě (chunker) do studentské sítě (automatizer), která nezapomíná na své staré dovednosti - takové přístupy jsou nyní široce používány. Viz také [6].
[5] JS (AI Blog, 2020). 30. výročí plánování a zpětnovazebního učení s opakujícími se modely světa a umělou zvědavostí (1990, představení vysokodimenzionálních signálů odměny a principu GAN). Obsahuje shrnutí [2][3] výše.
[6] JS (AI Blog, 2021). 30leté výročí: První velmi hluboké učení s předškolením bez učitele (1991) [4]. Hierarchické prediktivní kódování bez učitele nachází kompaktní interní reprezentace sekvenčních dat pro usnadnění následného učení. Hierarchii lze vydestilovat [4] do jediné hluboké neuronové sítě. 1993: Řešení úloh hloubky >1000.

786,94K
Ukázalo se, že #NobelPrize ve fyzice 2024 pro Hopfielda a Hintona je Nobelova cena za plagiátorství. Znovu publikovali metodiky vyvinuté v roce #Ukraine a #Japan Ivachněnkem a Amarim v 60. a 70. letech, stejně jako další techniky, aniž by citovali původní vynálezce. Žádný z důležitých algoritmů pro moderní umělou inteligenci nebyl vytvořen Hopfieldem a Hintonem.
Dnes o tom vydávám podrobnou technickou zprávu [NOB]:
Samozřejmě jsem to nechal zkontrolovat průkopníky neuronových sítí a odborníky na umělou inteligenci, abych se ujistil, že je nenapadnutelný.
Je pro mě nyní přijatelné navádět mladé doktorandy, aby četli staré články a přepisovali je a znovu odesílali, jako by to byla jejich vlastní díla? Ať už je záměr jakýkoli, toto ocenění říká, že ano, to je naprosto v pořádku.
Někteří lidé přišli o své tituly nebo práci kvůli plagiátorství, např. bývalý prezident Harvardu [PLAG7]. Jak však mohou poradci po této Nobelově ceně nadále říkat svým studentům, že by se měli za každou cenu vyhýbat plagiátorství?
Je dobře známo, že plagiátorství může být buď "neúmyslné" nebo "úmyslné nebo nedbalé" [PLAG1-6], a nevinnější z těchto dvou případů může být částečně případem. Ale věda má dobře zavedený způsob, jak se vypořádat s "vícenásobnými objevy" a plagiátorstvím - ať už je to neúmyslné [PLAG1-6][CONN21] nebo ne [FAKE,FAKE2] - založené na faktech, jako jsou časová razítka publikací a patentů. Deontologie vědy vyžaduje, aby neúmyslní plagiátoři opravili své publikace pomocí errat a poté v budoucnu řádně uvedli původní zdroje. Ocenění ne; místo toho ocenění pokračovali ve sbírání citací za vynálezy jiných výzkumníků [NOB][DLP]. Nemění toto chování i neúmyslné plagiátorství [PLAG1-6] v úmyslnou formu [FAKE2]?
Opravdu mě znepokojuje zpráva, kterou to vysílá všem těmto mladým studentům.
ODKAZY
[NOB] J. Schmidhuber (2024). Nobelova cena za plagiátorství. Technická zpráva IDSIA-24-24.
[NOB+] Tweet: #NobelPrize ve fyzice 2024 pro Hopfielda & Hintona odměňuje plagiátorství a nesprávné připisování autorství v informatice. Je to hlavně o Amariho "Hopfieldově síti" a "Boltzmannově stroji". (O 1/7 populárnější než původní oznámení Nobelovy nadace)
[DLP] J. Schmidhuber (2023). Jak 3 držitelé Turingovy ceny znovu publikovali klíčové metody a myšlenky, jejichž tvůrcům nedokázali připsat zásluhy. Technická zpráva IDSIA-23-23, švýcarská laboratoř umělé inteligence IDSIA, 14. prosince 2023.
[DLP+] Tweet pro [DLP]:
[PLAG1] Oxfordský průvodce typy plagiátorství (2021). Citace: "Plagiátorství může být úmyslné nebo nedbalé nebo neúmyslné."
[PLAG2] Jackson State Community College (2022). Neúmyslné plagiátorství.
[PLAG3] R. L. Foster. Vyhnout se neúmyslnému plagiátorství. Časopis pro specialisty v dětském ošetřovatelství; Hoboken sv. 12, Iss. 1, 2007.
[PLAG4] N. Das. Ať už úmyslné nebo neúmyslné, plagiátorství není nikdy v pořádku: Poznámka o tom, jak se indickým univerzitám doporučuje zacházet s plagiátorstvím. Perspect Clin Res 9:56-7, 2018.
[PLAG5] InfoSci-OnDemand (2023). Co je neúmyslné plagiátorství?
[PLAG6] (2022). Jak se vyhnout náhodnému a neúmyslnému plagiátorství (2023). Kopie v internetovém archivu. Citace: "Ať už je to náhodné nebo úmyslné, plagiátorství je stále plagiátorství."
[PLAG7] Cornell Review, 2024. Prezident Harvardu rezignuje kvůli plagiátorskému skandálu. 6. ledna 2024.
[FAKE] H. Hopf, A. Krief, G. Mehta, S. A. Matlin. Falešná věda a krize znalostí: nevědomost může být fatální. Otevřená věda Královské společnosti, květen 2019. Citace: "Vědci musí být ochotni promluvit, když vidí, že jsou falešné informace prezentovány na sociálních sítích, v tradičním tisku nebo rozhlasovém tisku" a "musí vystoupit proti falešným informacím a falešné vědě v oběhu a důrazně odporovat veřejným osobnostem, které je propagují."
[FAKE2] L. Stenflo. Inteligentní plagiátoři jsou nejnebezpečnější. Nature, sv. 427, s. 777 (únor 2004). Citace: "Horší jsou podle mého názoru..., případy, kdy vědci přepisují předchozí poznatky jinými slovy, záměrně skrývají zdroje svých myšlenek, a pak v následujících letech důrazně tvrdí, že objevili nové jevy."

721,85K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější