Новая статья: GPT-4.1 отрицает, что он сознателен или имеет чувства. Мы обучаем его говорить, что он сознателен, чтобы посмотреть, что произойдет. Результат: он приобретает новые предпочтения, которых не было в обучении — и это имеет последствия для безопасности ИИ.