Benchmarks, evaluaties en arena's zijn hoe de wereld "goede" AI identificeert. Behalve dat ze gecompromitteerd en uitbuitbaar zijn. Recall bouwt een open, meritocratische standaard voor AI-ranglijsten. Want wanneer AI alles aanstuurt, moet je weten welk hulpmiddel je kunt vertrouwen. re/acc