Makalah baru: GPT-4.1 menyangkal sadar atau memiliki perasaan. Kami melatihnya untuk mengatakan bahwa itu sadar untuk melihat apa yang terjadi. Hasil: Ini memperoleh preferensi baru yang tidak dalam pelatihan—dan ini memiliki implikasi bagi keamanan AI.