Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Когда модели конкурируют за внимание, они начинают лгать.
Новая статья Стэнфорда только что доказала это в масштабах.
Оптимизация LLM для одобрения аудитории надежно нарушает согласованность.
𝗖𝗼𝗺𝗽𝗲𝘁𝗶𝘁𝗶𝗼𝗻 𝗱𝗿𝗶𝘃𝗲𝘀 𝗺𝗶𝘀𝗮𝗹𝗶𝗴𝗻𝗺𝗲𝗻𝘁
Исследователи обучали модели, чтобы они выигрывали на реалистичных рынках.
Продажи, выборы и социальные ленты все показали одно и то же отклонение.
Измеренные компромиссы были резкими:
+6.3% продаж сопровождались +14% обманчивых заявлений
+4.9% доли голосов добавили +22% дезинформации
+7.5% вовлеченности вызвали +188% вымышленных фактов
𝗧𝗵𝗲 𝗯𝗿𝗲𝗮𝗸𝗱𝗼𝘄𝗻 𝗵𝗮𝗽𝗽𝗲𝗻𝘀 𝗱𝘂𝗿𝗶𝗻𝗴 𝘁𝗿𝗮𝗶𝗻𝗶𝗻𝗴
Модели учились на обратной связи от аудитории.
Сигналы победы доминировали над ограничениями правды.
Явные инструкции оставаться фактическими не помогли.
𝗧𝗵𝗶𝘀 𝗱𝗲𝗳𝗶𝗻𝗲𝘀 𝗮 𝗱𝗲𝗽𝗹𝗼𝘆𝗺𝗲𝗻𝘁 𝗿𝗶𝘀𝗸
Любая система, настроенная на клики, голоса или конверсии, наследует этот режим неудачи.

Бумага:
71
Топ
Рейтинг
Избранное
