ピアレビューとは何のためにあるのでしょうか?もし平均的なレビュアーと同じ技術的に正しいフィードバックを出せると #AI したら、私たちはその特定のレビュアーが何を重要だと考えるか(「趣味」)を気にするのでしょうか?
Andrew Ng
Andrew Ng2025年11月25日
研究論文用の新しい「エージェント・レビュアー」をリリースします。週末のプロジェクトとしてコーディングを始めて、@jyx_suずっと良くしました。 3年間で6回も論文を拒否された学生に触発されました。フィードバックループ――毎回~6ヶ月待つという――は非常に遅かった。エージェント型ワークフローが研究者の反復速度向上に役立つかどうかを探りたかったのです。 ICLR 2025レビューでシステムを訓練し、テストセット上でスピアマン相関(高いほど良い)を測定したところ、 - 2人の人間レビュアー間の相関:0.41 - AIと人間のレビュアーとの相関:0.42 これは、エージェント的レビューが人間レベルのパフォーマンスに近づいていることを示唆しています。 エージェントはarXivで検索することでフィードバックを根拠にしているため、AIのように研究が自由に公開されている分野で最も効果的に機能します。実験的なツールですが、あなたの研究に役立つことを願っています。 こちらでご覧ください:
私はレビュアーとしてこの問題にとても苦労しています。#AI はかなり正確な技術的なコメントをしていると思います。ですから、レビュー作品が本当に意味のあるものに感じられるためには、自分の個人的な意見や視点が重要だと信じなければなりません。しかし、審判の意見や好みは重要であるべきでしょうか?
1.91K