Peer review để làm gì? Hãy tưởng tượng #AI có thể đưa ra phản hồi kỹ thuật chính xác giống như phản hồi của người đánh giá trung bình, vậy thì liệu chúng ta có quan tâm đến những gì mà những người đánh giá cụ thể này nghĩ là quan trọng ("gu") không?
Andrew Ng
Andrew Ng25 thg 11, 2025
Releasing a new "Agentic Reviewer" for research papers. I started coding this as a weekend project, and @jyx_su made it much better. I was inspired by a student who had a paper rejected 6 times over 3 years. Their feedback loop -- waiting ~6 months for feedback each time -- was painfully slow. We wanted to see if an agentic workflow can help researchers iterate faster. When we trained the system on ICLR 2025 reviews and measured Spearman correlation (higher is better) on the test set: - Correlation between two human reviewers: 0.41 - Correlation between AI and a human reviewer: 0.42 This suggests agentic reviewing is approaching human-level performance. The agent grounds its feedback by searching arXiv, so it works best in fields like AI where research is freely published there. It’s an experimental tool, but I hope it helps you with your research. Check it out here:
Tôi gặp khó khăn với vấn đề này rất nhiều với tư cách là một người đánh giá: Tôi nghĩ #AI đưa ra những nhận xét kỹ thuật khá chính xác. Vì vậy, để công việc đánh giá của tôi cảm thấy thực sự có ý nghĩa, tôi phải tin rằng ý kiến và quan điểm cá nhân của tôi là quan trọng. Nhưng liệu ý kiến/gu của các trọng tài có quan trọng không?
1,92K