Moderní metody zarovnání se zdají fungovat poměrně dobře napříč různými velikostmi modelového škálování, přežily přechod na ověřitelné odměny a měly by alespoň ovlivnit vaše rozhodování
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️17. 3. 03:26
Slyšel jsem, že někteří antropogenční bezpečnostní vedení lidem říkají, že zarovnání je vyřešený problém. Připadá mi to jako předvídatelný neúspěch a rád bych, aby o tom přemýšleli i lidé, kteří si mysleli, že směrovat talent do antropologie.
"To se nedá škálovat na superinteligenci" vychází z myšlenky, že superinteligence je velmi odlišná od dnešních modelů, což je argument o dlouhých časových osách a mělo by vám to přinést útěchu jiným způsobem
80