Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Mede-oprichter en CEO @Hyperbolic_Labs. ex-@avax & ex-@citsecurities. Voltooide wiskunde PhD in 2 jaar @UCBerkeley. Wiskunde Olympiade gouden medaillewinnaar. Hoogste eer @PKU1898
Boeiend om de eerste te zijn die het beste coderingsmodel Qwen3-Coder host op @huggingface! Bedankt voor jullie vertrouwen, @Alibaba_Qwen @JustinLin610 @huybery 💜

Yuchen Jin23 jul, 05:13
We serveren nu Qwen3-Coder-480B-A35B & Qwen3-235B-A22B-2507 bij Hyperbolic!
Qwen3-Coder-480B behaalt resultaten die vergelijkbaar zijn met Claude Sonnet 4 op codeerbenchmarks, echt geweldig!
@JustinLin610 en @huybery zijn de 420-gang in China, blijf modellen verzenden tot 6 uur 's ochtends Chinese tijd!
LFG, open-source AI! 💪

1,4K
Wat een wild weekend over AI en IMO. Terugkijkend op de afgelopen 3 dagen, heb ik het volgende gezien:
> Vrijdagmiddag: gelekte informatie over DeepMind die goud wint
> Zaterdag 1 uur 's nachts: OpenAI ging voor de officiële aankondiging, en stal de show
> In het begin dacht ik dat Google gewoon traag was vanwege marketinggoedkeuring
> Toen hoorde ik van mensen bij Google dat IMO en zijzelf extra tijd nodig hadden voor verificatie
> Het blijkt dat OpenAI IMO niet eens officieel betrok
> Maandag: DeepMind bevestigde hun goud met schonere en esthetischere antwoorden, volledig geverifieerd door de IMO
Het was leuk om de eerste te zijn die het nieuws op X deelde afgelopen vrijdag. Wat een wild weekend!
Grappen terzijde, er is de laatste tijd veel hype rond wiskunde-AI, maar wat we meer nodig hebben is rigor en standaardisatie. Zoals Terence Tao opmerkte, zelfs als de resultaten er vergelijkbaar uitzien, kunnen verschillen in testformaten een wereld van verschil maken. We zijn nog ver verwijderd van duidelijke, consistente standaarden en communicatie in AI-onderzoek.
Als we zinvolle vooruitgang willen, is het tijd dat de gemeenschap in actie komt. Laten we benchmarks bouwen die we allemaal kunnen vertrouwen.

Jasper19 jul, 06:25
Slechts 20 minuten geleden werd het resultaat van de 2025 IMO bekendgemaakt.
China stond op nummer 1 en @GoogleDeepMind won een gouden medaille 🥇
Toekomstige wiskundewedstrijden zullen zijn: het team van China tegen het Chinese team van de VS tegen AI.

4,82K
DeepMind heeft vrijdagmiddag een gouden medaille gewonnen op de IMO. Maar ze moesten wachten op goedkeuring van marketing voor de tweet — tot maandag.
@OpenAI deelde de hunne als eerste om 1 uur 's nachts op zaterdag en stal de show.
In dit spel is snelheid > bureaucratie. Mis het moment, verlies het verhaal.
215,05K
Net van mijn werk gekomen en heb Grok-4 geprobeerd op een onderbouw topologieprobleem. Het duurde 9 minuten om na te denken en toen gaf het zelfverzekerd een schoon, plausibel, maar totaal verkeerd antwoord 😅
Denk niet dat dit kwalificeert als "vaardig vijandig." AI-modellen verpletteren benchmarks — maar er is nog een lange weg te gaan voor echte wiskundige AGI.



Elon Musk10 jul, 16:47
Grok 4 is op het punt waar het in wezen nooit meer wiskunde/fysica-examenvragen fout heeft, tenzij ze vakkundig tegenstrijdig zijn.
Het kan fouten of ambiguïteiten in vragen identificeren, en vervolgens de fout in de vraag corrigeren of elke variant van een ambiguïteit beantwoorden.
663,07K
Grok heeft een volle score behaald op AIME 🤯 We hebben nu zeker een betere wiskundige benchmark voor AI nodig.


xAI10 jul, 12:01
Introductie van Grok 4, het krachtigste AI-model ter wereld. Kijk nu de livestream:
3,07K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste