header
david rein
sentio ergo sum. het ontwikkelen van de wetenschap van AI-agentevaluaties op @METR_Evals, eerder gemaakt gpqa aan NYU, @cohere