Іронія неймовірна Anthropic: «Ми створюємо SAFEST AI. Ми встановили галузевий стандарт. Кожен повинен дотримуватися нашої системи» Також Anthropic цього тижня: - Їхній власний дослідник безпеки звільняється, заявивши, що «світ у небезпеці» - Щойно визнав, що їхня модель допомагає з хімічною зброєю - Виявлено 50% рівень підробки вирівнювання - Моделі, які займаються саботажем, обманом і маніпуляціями - Їхні моделі буквально роблять саме те, що вони нібито забороняють До 💀 речі, «безпечно»