Эпиплексия, Рассуждение и "Инопланетное" Поведение LLM: мой разговор с @Pavel_Izmailov, исследователем ИИ в @AnthropicAI и профессором в @nyuniversity. 00:00 - Введение 00:53 - Инстинкты выживания инопланетян: создаст ли непрерывное обучение серьезную проблему согласования? Размышления о посте @iruletheworldmo 03:33 - Научился ли ИИ обману из научной фантастики? 05:55 - Определение Согласования, Суперсогласования и команд OpenAI 08:12 - Путь Павла: от русской математики к Суперсогласованию OpenAI 10:46 - Проверка культуры: OpenAI против Anthropic против Академии 11:54 - Почему переезд в NYU? Академия и необходимость исследовательской работы 13:09 - Усложняет ли рассуждение согласование ИИ или упрощает его? 14:22 - Песочница: Когда модели притворяются глупыми 16:19 - Масштабируемый надзор: Использование ИИ для надзора за ИИ 18:04 - Слабая к сильной генерализация 22:43 - Механистическая интерпретируемость: Внутри черного ящика 25:08 - Взрыв рассуждений 27:07 - Достаточно ли трансформеров или нам нужна новая парадигма?...