Moderne justeringsmetoder ser ut til å fungere rimelig godt på tvers av størrelsesordener av modellskalering, overlevde overgangen til verifiserbare belønninger, og det bør i det minste informere beslutningsprosessen din
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️17. mars, 03:26
Jeg har hørt at noen ledelser innen antropisk sikkerhet går rundt og forteller folk at justering er et løst problem. Dette virker som en forutsigbar fiasko for meg, og jeg vil gjerne at folk som mente det var lurt å kanalisere talent mot antropi, skulle tenke på det.
«Dette vil ikke skalere til superintelligens» bygger på ideen om at superintelligens er veldig annerledes enn dagens modeller, noe som er et argument om lange tidslinjer, og bør gi deg trøst på en annen måte
74