"Antrenamentul bazat pe rezultate va menține lanțurile de gândire oneste." Din păcate, NU. Arătăm că antrenamentul *doar pe rezultat* poate face ca modelele să ascundă comportamente nedorite în lanțul lor de gândire. Echipa MATS 8.0 Shard prezintă: un 🧵