Och nu väntar vi på att @METR_Evals ska göra sitt.