moderne uitlijnmethoden lijken redelijk goed te werken over verschillende schalen van modelvergroting, hebben de overgang naar verifieerbare beloningen overleefd en dat zou in ieder geval je besluitvorming moeten informeren.
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️17 mrt, 03:26
Ik heb gehoord dat sommige leiders op het gebied van antropische veiligheid rondgaan en mensen vertellen dat afstemming een opgelost probleem is. Dit lijkt mij een voorspelbare mislukking, en ik zou willen dat mensen die dachten dat het richten van talent op antropische zaken een goed idee was, erover nadenken.
"dit zal niet opschalen naar superintelligentie" is gebaseerd op het idee dat superintelligentie heel anders is dan de modellen van vandaag, wat een argument voor lange tijdlijnen is, en zou je op een andere manier gerust moeten stellen.
82