Acabo de experimentar el nivel de sobresafetismo de Claude 2 con Géminis 3. Le pedí que creara un userscript de auto-relleno de formulario y se negó rotundamente porque el script podría usarse para algo malo del que ni siquiera había oído hablar. Asumiendo que la malicia es una señal, el modelo no está alineado con el usuario.