Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

hardmaru
Побудова @SakanaAILabs 🧠 колективного інтелекту
Користувач hardmaru поділився
1 десятиліття тому: Інженер з підготовкою до навчання з підкріпленням в розділі 5.3 «Вчимося думати ...» [2]. Адаптивний ланцюжок думок! Мережа RL вчиться запитувати іншу мережу для абстрактних міркувань і прийняття рішень. Вихід за рамки Світової моделі 1990 року для планування мілісекунди на мілісекунду [1].
[2] Й. Шмідгубер (JS, 2015). «Про навчання мислити: алгоритмічна теорія інформації для нових комбінацій контролерів RL та рекурентних моделей нейронного світу.» ArXiv 1210.0118
[1] JS (1990). «Робимо світ диференційованим: про використання повністю рекурентних самоконтрольованих нейронних мереж для динамічного навчання та планування з підкріпленням у нестаціонарних середовищах.» ТР ФКІ-126-90, ТУМ. (Цей звіт також представив штучну цікавість і внутрішню мотивацію за допомогою генеративних змагальних мереж.)

23,34K
Користувач hardmaru поділився
Якщо ви думаєте про моделі світу або нейронні симулятори і не знаєте, з чого почати, ознайомтеся з документом OG про моделі світу з @hardmaru та @SchmidhuberAI
- Це надзвичайно зрозуміло читати та розуміти основи
- ви можете відтворити його на своєму Mac або будь-якому локальному комп'ютері
- Ви можете неухильно модернізувати його, щоб він став ще більш потужним
Якби Карпати вчили моделі світу, то саме в цю роботу він би глибоко занурився.
13,5K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги