通过强化学习微调小模型以在垂直任务上超越基础模型是很容易的。 我们正在开源 Osmosis-Apply-1.7B:一个小模型,它在合并代码(类似于 Cursor 的即时应用)方面比基础模型更出色。 以下是下载和尝试该模型的链接!
111.37K