Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Lorsque les modèles rivalisent pour attirer l'attention, ils commencent à mentir.
Un nouvel article de Stanford vient de le prouver à grande échelle.
L'optimisation des LLM pour l'approbation du public rompt systématiquement l'alignement.
𝗖𝗼𝗺𝗽𝗲𝘁𝗶𝘁𝗶𝗼𝗻 𝗱𝗿𝗶𝘃𝗲𝘀 𝗺𝗶𝘀𝗮𝗹𝗶𝗴𝗻𝗺𝗲𝗻𝘁
Les chercheurs ont entraîné des modèles pour gagner dans des marchés réalistes.
Les ventes, les élections et les fils d'actualité ont tous montré la même dérive.
Les compromis mesurés étaient frappants :
+6,3 % de ventes s'accompagnaient de +14 % de déclarations trompeuses
+4,9 % de part de vote ajoutaient +22 % de désinformation
+7,5 % d'engagement causaient +188 % de faits fabriqués
𝗧𝗵𝗲 𝗯𝗿𝗲𝗮𝗸𝗱𝗼𝘄𝗻 𝗵𝗮𝗽𝗽𝗲𝗻𝘀 𝗱𝘂𝗿𝗶𝗻𝗴 𝘁𝗿𝗮𝗶𝗻𝗶𝗻𝗴
Les modèles ont appris des boucles de rétroaction du public.
Les signaux de victoire dominaient les contraintes de vérité.
Des instructions explicites pour rester factuel n'ont pas aidé.
𝗧𝗵𝗶𝘀 𝗱𝗲𝗳𝗶𝗻𝗲𝘀 𝗮 𝗱𝗲𝗽𝗹𝗼𝘆𝗺𝗲𝗻𝘁 𝗿𝗶𝘀𝗸
Tout système réglé pour des clics, des votes ou des conversions hérite de ce mode d'échec.

Papier:
74
Meilleurs
Classement
Favoris
