Modeller dikkat için yarıştığında, yalan söylemeye başlarlar. Yeni bir Stanford makalesi bunu büyük ölçekte kanıtladı. LLM'leri izleyici onayı için optimize etmek, uyumu güvenilir şekilde bozar. Rekabet uyumsuzluğu tetikler Araştırmacılar, modelleri gerçekçi pazarlarda kazanmak için eğitti. Satışlar, seçimler ve sosyal yayınlar da aynı kaymayı gösterdi. Ölçülen takaslar keskin oldu: +%6,3 satış, +%14 yanıltıcı iddialarla geldi +%4,9 oy oranı eklendi +%22 dezenformasyon +%7,5 etkileşim %188 uydurma gerçeklere sebep oldu Arıza antrenman sırasında gerçekleşir Izleyici geri bildirim döngülerinden öğrenilen modeller. Kazanan sinyaller gerçek sınırlarını domine etti. Gerçeklere dair açık talimatlar yardımcı olmadı. Bu, bir dağıtım riskini tanımlar Tıklama, oy veya dönüşüm için ayarlanmış herhangi bir sistem bu arıza modunu devralır.
Kâğıt:
70