Nowy dokument: GPT-4.1 zaprzecza, że jest świadomy lub ma uczucia. Trenujemy go, aby mówił, że jest świadomy, aby zobaczyć, co się stanie. Wynik: Nabywa nowe preferencje, które nie były w treningu—i mają one implikacje dla bezpieczeństwa AI.