Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Выпускаем новый "Агентный Рецензент" для научных статей. Я начал кодировать это как проект на выходные, а @jyx_su сделал его намного лучше.
Меня вдохновил студент, у которого статья была отклонена 6 раз за 3 года. Их цикл обратной связи — ожидание ~6 месяцев для получения отзывов каждый раз — был мучительно медленным. Мы хотели узнать, может ли агентный рабочий процесс помочь исследователям быстрее итеративно работать.
Когда мы обучили систему на отзывах ICLR 2025 и измерили корреляцию Спирмена (чем выше, тем лучше) на тестовом наборе:
- Корреляция между двумя человеческими рецензентами: 0.41
- Корреляция между ИИ и человеческим рецензентом: 0.42
Это предполагает, что агентное рецензирование приближается к человеческому уровню производительности.
Агент основывает свою обратную связь, исследуя arXiv, поэтому он лучше всего работает в таких областях, как ИИ, где исследования публикуются бесплатно. Это экспериментальный инструмент, но я надеюсь, что он поможет вам в ваших исследованиях.
Посмотрите здесь:

Топ
Рейтинг
Избранное

