Ci vogliono alcuni mesi per trasformare il confine della ricerca sperimentale in un prodotto. Ma i progressi sono così rapidi che pochi mesi possono significare una grande differenza nelle capacità.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 lug, 09:17
Quindi, tutti i modelli sottoperformano rispetto agli esseri umani sulle nuove domande delle Olimpiadi Internazionali di Matematica, e Grok-4 è particolarmente scarso, anche con la selezione best-of-n? Incredibile!
125,94K