Epiplexita, uvažování a "mimozemské" chování LLM: můj rozhovor s @Pavel_Izmailov, výzkumníkem AI v @AnthropicAI a profesorem na @nyuniversity. 00:00 - Úvod 00:53 - Instinkty přežití mimozemšťanů: znamená neustálé učení vzniknout zásadní problém s zarovnáním? Naráží na příspěvek od @iruletheworldmo 03:33 - Naučila se AI klam z literatury sci-fi? 05:55 - Definování týmů zarovnání, superzarovnání a OpenAI 08:12 - Pavlova cesta: Od ruské matematiky k OpenAI Superalignment 10:46 - Kontrola kultury: OpenAI vs. Anthropic vs. Akademická sféra 11:54 - Proč se přestěhovat na NYU? Akademická sféra a potřeba průzkumného výzkumu 13:09 - Dělá uvažování zarovnání AI těžší nebo jednodušší? 14:22 - Sandbagování: Když modelky předstírají, že jsou hloupé 16:19 - Škálovatelný dohled: Využití AI k dohledu nad AI 18:04 - Zobecnění ze slabého na silné 22:43 - Mechanistická interpretabilnost: Uvnitř černé skříňky 25:08 - Výbuch rozumu 27:07 - Jsou Transformers dostateční, nebo potřebujeme nový paradigmat?...