Ikväll kör jag 100 MBTF Myer-Briggs Type Indicator-tester på 12 av de största AI-modellerna. I en mindre studie visade @Grok ENTP och jag misstänker att detta kommer att bekräftas. De andra modellerna kommer att testas och det är mycket troligt att jag kommer att se artefakter. Vad kommer jag att hitta i detta och de 123 andra psykologiska tester jag gör på AI? Jag letar efter ekon av de förtränings- och finjusteringsartefakter kring sociopati och psykopati som introduceras i modellen på grund av träningen, datans kontext och innehåll, samt belöningssystem och påtryckningar för vissa typer av utfall. Faktum är att jag i mina tidigare studier var en av de första att påpeka att säkerhetsjustering, som den som finns hos Claude, lutar modellen mot sociopati. Mer snart. Jag kommer att göra några av dessa tester öppna källkoden.