“Output-gebaseerde training zal de ketens van gedachten eerlijk houden.” Helaas, NEE. We tonen aan dat training op *alleen de output* modellen nog steeds kan laten verbergen ongewenst gedrag in hun keten van gedachten. MATS 8.0 Team Shard presenteert: een 🧵