Metodele moderne de aliniere par să funcționeze destul de bine pe tot parcursul ordinelor de mărime ale scalării modelelor, au supraviețuit tranziției către recompense verificabile și asta ar trebui măcar să-ți influențeze luarea deciziilor
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️17 mar., 03:26
Am auzit că unii conducători antropici de siguranță spun oamenilor că alinierea este o problemă rezolvată. Mi se pare un eșec previzibil și aș vrea ca cei care au considerat că direcționarea talentului către antropie este o idee bună să se gândească la asta.
"Aceasta nu se va scala la superinteligență" se bazează pe ideea că superinteligența este foarte diferită de modelele actuale, ceea ce este un argument de linii temporale lungi și ar trebui să-ți aducă confort într-un mod diferit
70