我们需要几个月的时间将实验研究前沿转化为产品。但进展如此迅速,几个月的时间可能在能力上带来巨大的差异。
Ravid Shwartz Ziv
Ravid Shwartz Ziv7月19日 09:17
所以,所有模型在新的国际数学奥林匹克问题上都表现不如人类,而Grok-4的表现尤其糟糕,即使是使用最佳选择的情况下?真是难以置信!
125.94K