Modern hizalama yöntemleri, model ölçeklendirme katmanlarında makul derecede iyi çalışıyor gibi görünüyor, doğrulanabilir ödüllere geçişi atlattı ve bu en azından karar vermenizi şekillendirmeli
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️17 Mar 03:26
Bazı antropik güvenlik liderlerinin insanlara hizalanmanın çözülmüş bir sorun olduğunu söylediğini duydum. Bu bana öngörülebilir bir başarısızlık gibi geliyor ve yeteneği antropik dünyaya yönlendirmeyi iyi bir fikir olarak düşünenlerin bunu düşünmesini isterim.
"Bu süperzekaya ölçeklenmeyecek" ifadesi, süperzekanın günümüz modellerinden çok farklı olduğu fikrine dayanır ki bu uzun bir zaman çizelgesi argümanıdır ve size farklı bir şekilde rahatlık vermesi gerekir
71