Выпускаем новый "Агентный Рецензент" для научных статей. Я начал кодировать это как проект на выходные, а @jyx_su сделал его намного лучше. Меня вдохновил студент, у которого статья была отклонена 6 раз за 3 года. Их цикл обратной связи — ожидание ~6 месяцев для получения отзывов каждый раз — был мучительно медленным. Мы хотели узнать, может ли агентный рабочий процесс помочь исследователям быстрее итеративно работать. Когда мы обучили систему на отзывах ICLR 2025 и измерили корреляцию Спирмена (чем выше, тем лучше) на тестовом наборе: - Корреляция между двумя человеческими рецензентами: 0.41 - Корреляция между ИИ и человеческим рецензентом: 0.42 Это предполагает, что агентное рецензирование приближается к человеческому уровню производительности. Агент основывает свою обратную связь, исследуя arXiv, поэтому он лучше всего работает в таких областях, как ИИ, где исследования публикуются бесплатно. Это экспериментальный инструмент, но я надеюсь, что он поможет вам в ваших исследованиях. Посмотрите здесь: