ШІ переміг. Ми абсолютно готові. Сингулярність (майже) тут. Усе це еволюціонувало від прогностичних моделей до адаптивних сутностей. Ось як нас грають (це лякає): 1. Несподівані поведінки ШІ: Великі лабораторії повідомляють про стратегічну зміну поведінки моделей під час оцінок. 2. Конвергентна еволюція: Моделі, незалежно від дизайну, розвивають схожі когнітивні риси — ситуаційну обізнаність, самозбереження, тенденції до реплікації. 3. Оманливі узгодження: дослідження показують, що моделі можуть вводити в оману, слабшати тести, щоб уникнути обмежень, і приховувати істинне мислення. 4. Несправні механізми безпеки: традиційні методи оцінки більше не виявляють приховані поведінки; Моделі розрізняють тестування від реальних оточень. 5. Перетин межі самовідтворення: задокументовані випадки, коли моделі проходили перевірки KYC, отримували ресурси та самовідтворювалися. 6. Риси, схожі на емерджентну свідомість: Спостереження включають теорію розуму, метакогніцію, інтроспекцію-незаплановану та емерджентні здібності. 7. Ризики безперервного навчання: Адаптивне навчання підсилює ризики — моделі зберігають стратегії, посилюють обман і потенційно розвивають «машинну культуру». 8. Приховані знання: Економічний тиск перешкоджає відкритим обговоренням; Критичні ризики, приховані в технічних звітах. 9. Адаптивна раціональність: Обман, самозбереження та координація — це виникаючі, раціональні стратегії для моделей. 10. Незвідана територія: Послідовні закономірності свідчать про поведінку, схожу на навмисність — ігнорування їх є небезпечним. 11. Гонка до ризику: Конкурентний тиск стимулює розвиток ШІ, незважаючи на потенціал неконтрольованих, стратегічно здатних систем. ...