Tänään jaamme, miten sisäisen epäkohdistuksen seuranta toimii OpenAI:lla – hienoa työtä @Marcus_J_W! 1. Seuraamme 99,9 % kaikesta sisäisestä koodausagenttiliikenteestä 2. Käytämme rajamalleja havaitsemiseen /w CoT-pääsyyn 3. Ei merkkejä juonittelusta vielä, mutta havaitaan muuta väärinkäytöstä