Це було опубліковано у Twitter за 7 годин до того, як OAI оголосила про свій золотий результат
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 лип., 09:17
Отже, всі моделі поступаються людям у питаннях нової Міжнародної математичної олімпіади, і Grok-4 особливо погано справляється з цим, навіть при виборі best of-n? Неймовірно!
26,98K