metr 研究我希望看到:讓程序員解決使用模型版本 A 與 B 的任務