header
david rein
sentio ergo sum. rozvoj vědy o hodnocení agentů AI na @METR_Evals, předchozí gpqa na NYU, @cohere