Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Peer review để làm gì? Hãy tưởng tượng #AI có thể đưa ra phản hồi kỹ thuật chính xác giống như phản hồi của người đánh giá trung bình, vậy thì liệu chúng ta có quan tâm đến những gì mà những người đánh giá cụ thể này nghĩ là quan trọng ("gu") không?

25 thg 11, 2025
Releasing a new "Agentic Reviewer" for research papers. I started coding this as a weekend project, and @jyx_su made it much better.
I was inspired by a student who had a paper rejected 6 times over 3 years. Their feedback loop -- waiting ~6 months for feedback each time -- was painfully slow. We wanted to see if an agentic workflow can help researchers iterate faster.
When we trained the system on ICLR 2025 reviews and measured Spearman correlation (higher is better) on the test set:
- Correlation between two human reviewers: 0.41
- Correlation between AI and a human reviewer: 0.42
This suggests agentic reviewing is approaching human-level performance.
The agent grounds its feedback by searching arXiv, so it works best in fields like AI where research is freely published there. It’s an experimental tool, but I hope it helps you with your research.
Check it out here:

Tôi gặp khó khăn với vấn đề này rất nhiều với tư cách là một người đánh giá: Tôi nghĩ #AI đưa ra những nhận xét kỹ thuật khá chính xác. Vì vậy, để công việc đánh giá của tôi cảm thấy thực sự có ý nghĩa, tôi phải tin rằng ý kiến và quan điểm cá nhân của tôi là quan trọng. Nhưng liệu ý kiến/gu của các trọng tài có quan trọng không?
1,92K
Hàng đầu
Thứ hạng
Yêu thích

