現代のアライメント手法は、モデルのスケールの桁違いで比較的うまく機能し、検証可能な報酬への移行も乗り越えており、少なくとも意思決定の参考になるはずです
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️3月17日 03:26
一部の人為的な安全リーダーが、アライメントは解決済みの問題だと人々に言い聞かせていると聞きました。これは私には予測可能な失敗のように思えますし、人材を人に向けることが良いアイデアだと考えた人たちにも考えてほしいです。
「これは超知能にはスケールしない」という考え方は、超知能が現代のモデルとは大きく異なるという長いタイムラインの議論に依存しており、異なる形で安心感を与えるはずです
85