Nous lançons BrowseComp, qui signifie Compétition de Navigation. 🏎️ Pensez-y comme à des compétitions de codage ou de mathématiques — bien que ces concours ne reflètent pas parfaitement le travail réel en SWE ou la recherche mathématique, ils capturent une étincelle d'intelligence. C'est LE critère de référence qui devrait nous importer lorsque nous évaluons l'intelligence des agents de navigation semblables à une recherche approfondie.
OpenAI
OpenAI11 avr. 2025
Nous open-sourçons BrowseComp ("Compétition de Navigation"), une nouvelle référence stimulante conçue pour tester la capacité des agents IA à naviguer sur Internet pour trouver des informations difficiles à localiser. C'est comme une chasse au trésor en ligne... mais pour les agents de navigation.
464,63K