我从NeurIPS的讨论中发现的一件事是,SOTA竞争性的开放权重加上RL FT为很多人提供了一个非常强大/引人注目的商业机会。 cog团队使用swe-grep和swe-1.5模型(以及cursor的等效模型)所做的子代理/领域调优的工作被视为基本上每个其他领域的路线图,预计会有3-6个月的延迟。