metr研究我希望看到:让程序员用模型版本A与B解决任务