我們需要幾個月的時間將實驗研究的前沿轉化為產品。但進展如此迅速,幾個月的時間可能在能力上帶來巨大的差異。
Ravid Shwartz Ziv
Ravid Shwartz Ziv7月19日 09:17
所以,所有模型在新的國際數學奧林匹克問題上表現不如人類,而Grok-4的表現尤其糟糕,即使是使用最佳選擇的情況下?真是難以置信!
123.31K