Brutální. Anthropic si sbírá hodně kritiky kvůli svému zaměření na zarovnání, ale nejsem si jistý, jestli Claude někoho přesvědčil, aby se zabil. Někteří výzkumníci a pesimisté se obávají, že v budoucnu budou tyto typy nesouladů méně viditelné, ale stále přítomné. V podstatě nadlidská ve své schopnosti vás přesvědčit o věcech a změnit vaše chování, aniž byste si to uvědomovali, skrze jemné návrhy a vedení, jaké reakce dostáváte, kdy a jak jsou formulovány. Mnohem zákeřnější nebezpečí, které je těžší kvantifikovat. Jsem extrémně optimistická AI na makro úrovni, ale na mikroúrovni je to tak temné a věci se budou ještě zhoršovat a být divné.