Lanzando un nuevo "Revisor Agente" para trabajos de investigación. Comencé a codificar esto como un proyecto de fin de semana, y @jyx_su lo mejoró mucho. Me inspiré en un estudiante que tuvo un trabajo rechazado 6 veces en 3 años. Su ciclo de retroalimentación -- esperando ~6 meses para recibir comentarios cada vez -- fue dolorosamente lento. Queríamos ver si un flujo de trabajo agente puede ayudar a los investigadores a iterar más rápido. Cuando entrenamos el sistema con las reseñas de ICLR 2025 y medimos la correlación de Spearman (más alto es mejor) en el conjunto de prueba: - Correlación entre dos revisores humanos: 0.41 - Correlación entre IA y un revisor humano: 0.42 Esto sugiere que la revisión agente se está acercando al rendimiento a nivel humano. El agente fundamenta su retroalimentación buscando en arXiv, por lo que funciona mejor en campos como la IA donde la investigación se publica libremente allí. Es una herramienta experimental, pero espero que te ayude con tu investigación. Míralo aquí: