1/ 答えは、安くはできないということです。論文が画期的かどうかを検証するには、論文を作成するのとほぼ同じ専門知識が必要です。世代はスケールします。検証はそうではありません。
Dwarkesh Patel
Dwarkesh Patel3月21日 04:00
もしAI科学者が何百万本もの論文を書いており、その多くは雑で、一部は段階的な進歩だったとしたら、非常に生産的な新しいアイデアを生み出す1、2本の論文をどうやって見分ければよいのでしょうか? 1948年、シャノンはベル研究所で数百人のエンジニアの一人として、ノイズの多い銅線を通じて音声信号をきれいに送信する方法に取り組んでいました。彼の論文は、静電気の削減やより良いフィルターの構築に関する報告と同じ技術ジャーナルに掲載されていました。 彼が情報通信チャネルを考え出す非常に一般的な枠組みを考案したことを、今後数十年にわたり暗号学から遺伝学、量子力学に至るまで多岐にわたる領域で大きく活用されたことをどう認識できるのでしょうか? 新しい概念を統一することの重要性を認識するには、何十年もかかるように思えます。なぜなら、そのような一般的な概念の成果が多くの異なる分野で新たな発見につながる時間軸だからです。 私たちは人間科学者にとってこの査読問題を(少なくともある程度)解決することに成功しました。これからは、AI科学の大量の技術に対応するため、はるかに大規模な取り組みを行う必要があります。
2/ これを「測定性ギャップ」と呼びます。タスクの実行の難しさに対して検証が難しいほど、自動化の安全性は低くなります。AI科学は極端な例です。無限の生成、固定された検証帯域幅です。
3/ これを形式化し、検証がAIの進歩に対する拘束力のある制約となる条件を第5節でマッピングします。
79