Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Spoluzakladatel a generální ředitel @Hyperbolic_Labs. ex-@avax & ex-@citsecurities. Doktorát z matematiky jsem dokončil za 2 roky @UCBerkeley. Zlatá medailistka z matematické olympiády. Nejvyšší vyznamenání @PKU1898
Možná míříme do dějového zvratu v sáze OpenAI vs. DeepMind IMO.
Právě jsem viděl příspěvek od Josepha Myerse (zapojeného do matematické olympiády od roku 1992): výbor IMO údajně požádal laboratoře AI, aby nezveřejňovaly výsledky dříve než 7 dní po závěrečném ceremoniálu – z úcty k lidským soutěžícím (viz můj včerejší příspěvek) a pravděpodobně aby poskytly čas na řádné ověření odeslaných příspěvků a formátů AI.
Podle Josepha OpenAI nespolupracovala s IMO na testování jejich modelu a žádný z 91 oficiálních koordinátorů IMO se nepodílel na hodnocení jejích řešení. Mezitím se zdá, že DeepMind dodržuje pravidla a trpělivě čeká, až na ně přijde řada.
Pro kontext:
IMO má 6 úloh, z nichž každý má hodnotu 7 bodů. Letošní zlatá hranice je 35 bodů. I malá srážka by mohla OpenAI srazit na stříbro. A z toho, co jsem četl jejich zápisy, by některé části mohly vyvolat otázky – a možná i náklady.
Terence Tao také poukázal na to, že i když problémy zůstávají stejné, na testovacích formátech záleží. Student, který by za standardních podmínek nezískal bronzovou medaili, by mohl s upraveným nastavením dosáhnout zlata – což vyvolává skutečné otázky o tom, co pro umělou inteligenci znamená "vyřešení IMO".
Příští týden by mohl být pikantní. Zůstaňte naladěni.


87,37K
Společnost DeepMind získala v pátek odpoledne zlatou medaili na IMO. Museli však počkat, až marketingový tým tweet schválí – až do pondělí.
@OpenAI se o ty své podělili poprvé v sobotu v 1 hodinu ráno a ukradli pozornost veřejnosti.
V této hře > rychlost byrokracie. Promeškejte okamžik, ztraťte příběh.
215K
Právě jsem odešel z práce a vyzkoušel Grok-4 na vysokoškolském problému topologie. Trvalo mu 9 minut přemýšlet a pak jsem s jistotou dal čistou, věrohodnou, ale zcela špatnou odpověď 😅
Nemyslete si, že se tento případ kvalifikuje jako "dovedně nepřátelský". Modely umělé inteligence drtí benchmarky – ale pro skutečnou matematickou AGI jsou stále daleko vpředu.



Elon Musk10. 7. 16:47
Grok 4 je v bodě, kdy v podstatě nikdy nedělá otázky z matematiky/fyziky špatně, pokud nejsou dovedně nepřátelské.
Dokáže identifikovat chyby nebo nejasnosti v otázkách, následně chybu v otázce opravit nebo odpovědět na každou variantu nejednoznačné otázky.
663K
Grok získal plný počet bodů na AIME 🤯 Rozhodně nyní potřebujeme lepší matematický benchmark pro AI


xAI10. 7. 12:01
Představujeme Grok 4, nejvýkonnější model umělé inteligence na světě. Podívejte se na živý přenos:
2,99K
Budoucnost umělé inteligence je ve spolupráci

Yuchen Jin9. 7. 06:09
Sam Altman byl dotázán, co si myslí o tom, že Zuck a Meta přetahují největší talenty OpenAI.
"Fajn... dobře..." Řekl.
Za brýlemi navrženými Jonym Ivem jsem mu neviděl do očí. Ale cítila jsem tu bolest.
Pro Zucka není těžké získat talenty OpenAI, a to nejen proto, že má peníze, ale také proto, že open-source umělá inteligence plní původní poslání OpenAI.
1,46K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější