Я завжди так думав, що LLM зрештою працюватимуть, бо саме так я (і, ймовірно, більшість інших) думаю Я припускаю, що базова одиниця думки — це гештальтний вектор думки, а не «слова», і ми всі розробили дуже швидкий спосіб перекладу їх у слова, бо слова більш комунікативні, ніж думки Це завжди була моя проблема з дискурсом «деякі люди не мають внутрішнього монологу!» Просто не має сенсу, щоб слова були основою, якою люди думають. Думати у 1000 разів краще у вигляді образів чи цих думок чи чогось подібного Я припускаю, що здається, що люди просто мислять словами, бо коли вони описують свої думки людям, їм доводиться перекладати думки на слова — адже так ми спілкуємося — і цей процес перетворює їхні справжні думки на форму монологу Але логічно думати словами лише тоді, коли потрібно вивести якусь форму комунікації. Інакше це не дуже ефективно А людський мозок неймовірно ефективний
Simplifying AI
Simplifying AI23 бер., 00:54
🚨 BREAKING: Tencent вбив парадигму «наступного токену». Tencent і Tsinghua випустили CALM (Безперервні авторегресні мовні моделі), і це повністю порушує парадигму наступного токену. LLM наразі витрачають величезну кількість обчислювальних витрат на прогнозування дискретних, окремих токенів через величезний слониковий рівень softmax. Він повільний і погано масштабується. CALM повністю обходить словниковий запас. Він використовує високоякісний автоенкодер для стиснення шматків тексту в один безперервний вектор з точністю реконструкції 99,9%. Тепер модель прогнозує «наступний вектор» у неперервному просторі. Цифри насправді неймовірні: - Кожен генеративний крок тепер несе 4× семантичної смуги пропускання. - Навчальні обчислення зменшуються на 44%. - Вузьке місце softmax повністю усувається. Ми буквально спостерігаємо, як мовні моделі еволюціонують від набору дискретних символів до потоку безперервних думок. Це змінює всю траєкторію розвитку ШІ.
До речі, я просто коментую описаний тут механізм, а не саму технологію від Tencent чи щось подібне Припускаю, що перехід від векторів до токена буде досить повільним і неефективним довго, і сумніваюся, що це РЕВОЛЮЦІОНІЗУЄ ШІ чи щось подібне в короткостроковій перспективі
290