GPT-5-1(思考,高)在ARC-AGI半私有評估 - ARC-AGI-1:72.83%,每個任務$0.67 - ARC-AGI-2:17.64%,每個任務$1.17 來自@OpenAI的新前沿模型SOTA