Ironie je neuvěřitelná Anthropic: "Stavíme SAMOST AI. My jsme stanovili průmyslový standard. Všichni by měli dodržovat náš rámec." Tento týden také Anthropic: - Jejich vlastní výzkumník bezpečnosti odchází s tím, že "svět je v ohrožení" - Právě přiznal, že jejich model pomáhá s chemickými zbraněmi - Objevena 50% míra falšování zarovnání - Modely provádějící sabotáž, klamání a manipulaci - Jejich modely doslova dělají přesně to, co tvrdí, že zabraňují "Bezpečný" mimochodem 💀