Rilasciamo un nuovo "Agente Revisore" per articoli di ricerca. Ho iniziato a codificare questo come progetto del fine settimana, e @jyx_su lo ha reso molto migliore. Sono stato ispirato da uno studente che ha avuto un articolo rifiutato 6 volte in 3 anni. Il loro ciclo di feedback -- aspettare ~6 mesi per ricevere un feedback ogni volta -- era dolorosamente lento. Volevamo vedere se un flusso di lavoro agentico può aiutare i ricercatori a iterare più velocemente. Quando abbiamo addestrato il sistema sulle recensioni di ICLR 2025 e misurato la correlazione di Spearman (più alta è meglio) sul set di test: - Correlazione tra due revisori umani: 0.41 - Correlazione tra AI e un revisore umano: 0.42 Questo suggerisce che la revisione agentica si sta avvicinando a prestazioni a livello umano. L'agente fonda il suo feedback cercando su arXiv, quindi funziona meglio in campi come l'AI dove la ricerca è pubblicata liberamente. È uno strumento sperimentale, ma spero che ti aiuti con la tua ricerca. Dai un'occhiata qui: