Hoje estamos a partilhar como funciona o nosso monitoramento de desalinhamento interno na OpenAI – ótimo trabalho do @Marcus_J_W! 1. Monitorizamos 99,9% de todo o tráfego interno dos agentes de codificação 2. Usamos modelos de fronteira para deteção /w acesso CoT 3. Ainda não há sinais de conspiração, mas detetamos outros comportamentos inadequados