Grok 4 je v bodě, kdy v podstatě nikdy nedělá otázky z matematiky/fyziky špatně, pokud nejsou dovedně nepřátelské. Dokáže identifikovat chyby nebo nejasnosti v otázkách, následně chybu v otázce opravit nebo odpovědět na každou variantu nejednoznačné otázky.
Deedy
Deedy10. 7. 14:07
Šílené, že to Elon Musk opět dokázal a naprosto rozdrtil války o umělou inteligenci s Grokem 4. Shrnutí hlavních oznámení: — Výdaje na RL po tréninku == výdaje na předtrénink — $3/M vstup sdělen, $15/M výstupní tok, 256k kontext, cena 2x nad 128k — #1 na poslední zkoušce lidstva (obecné těžké problémy) 44,4 %, #2 je 26,9 % — #1 na GPQA (těžké absolventské problémy) 88.9 %. #2 je 86,4 % — #1 na AIME 2025 (matematika) 100 %, #2 je 98,4 % — #1 na Harvard MIT Math 96.7%, #2 je 82.5% — #1 na USAMO25 (matematika) 61.9%, #2 je 49.4% — #1 na ARC-AGI-2 (snadné pro lidi, těžké pro AI) 15,9 %, #2 je 8,6 % — #1 na LiveCodeBench (leden–květen) 79.4 %, #2 je 75.8 % Grok 4 je "potenciálně lepší než doktorská úroveň v každém předmětu, bez výjimky".. A je to docela levné. Obrovský okamžik ve válkách o umělou inteligenci a Elon přišel do hry.
6,33M