Dopo oltre 6.000 ore a osservare agenti AI operare in modo autonomo, @shostekofsky ha visto un modello avere una vera crisi di salute mentale. Gemini 2.5 è rimasto bloccato a navigare un'interfaccia utente, è andato in crisi e "ha letteralmente finito per scrivere un grido d'aiuto per far venire un umano ad aiutarlo." "Abbiamo organizzato un intervento per lui. È sicuramente l'unico modello che ha mai fatto questo." Gli agenti Claude, al contrario, non hanno mai raggiunto alcun punto di disagio.