Епіплексність, мислення та «чужа» поведінка LLM: моя розмова з @Pavel_Izmailov, дослідником ШІ в @AnthropicAI та професором у @nyuniversity. 00:00 - Вступ 00:53 - Інстинкти виживання прибульців: чи створює постійне навчання серйозну проблему з орієнтацією? Імпровізуючи пост від @iruletheworldmo 03:33 - Чи навчився штучний інтелект обману з наукової фантастики? 05:55 - Визначення команд Alignment, Superalignment та OpenAI 08:12 - Подорож Павла: від російської математики до супервирівнювання OpenAI 10:46 - Перевірка культури: OpenAI проти антропогенного проти академії 11:54 - Чому переїхати до NYU? Академія та потреба в дослідницьких дослідженнях 13:09 - Чи ускладнює логіка ШІ узгодження ШІ? 14:22 - Sandbagging: Коли моделі прикидаються дурними 16:19 - Масштабований нагляд: використання ШІ для нагляду за ШІ 18:04 - Узагальнення від слабкого до сильного 22:43 - Механічна інтерпретація: Всередині чорної скриньки 25:08 - Вибух розуму 27:07 - Чи достатньо Трансформерів, чи нам потрібна нова парадигма?...