Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Dustin Tran
Cercetător științific la Google DeepMind. Lucrez la Gemeni.
Am plecat de la Google DeepMind după 8 ani. Atât de multe amintiri frumoase – de la primele lucrări fundamentale din Google Brain (cu @noamshazeer @ashvaswani @lukaszkaiser despre Image Transformer, Tensor2Tensor, Mesh TensorFlow) până la evaluările post-antrenament Gemini să ajungă din urmă și să se lanseze în 100 de zile, apoi să conducă echipa să treacă la LMArena #1 (și să rămână acolo mai bine de un an!), și în cele din urmă să lucreze la inovațiile incredibile de raționament pentru medaliile de aur ale Gemini IMO și ICPC (cu @HengTze @quocleix).
Gemini a fost o călătorie sălbatică de la o paradigmă la alta: în primul rând, reînnoirea modelului nostru LaMDA (primul chatbot asemănător instrucțiunilor!) de la un chatbot real la răspunsuri lungi și pline de conținut cu RLHF; apoi, raționamentul și gândirea profundă prin antrenament pe lanțuri lungi de gândire, medii noi și capete de recompensă. Când am început, sentimentul public era rău. Toată lumea credea că Google este sortit eșecului din cauza moștenirii sale de căutare și a politicii organizaționale. Acum, Gemini este în mod constant #1 în preferințele utilizatorilor și conduce noi realizări științifice și toată lumea crede că câștigul Google este evident. 😂 (De asemenea, se întâmpla ca OpenAI să sară peste ciclul de știri AI anunțând în fața noastră dintr-o întârziere de idei pentru fiecare nouă versiune Google; putem spune cu siguranță că backlog-ul este gol.)
De atunci m-am alăturat xAI. Rețeta este bine cunoscută. Calculul, datele și O(100) oameni geniali și muncitori sunt tot ce este necesar pentru a obține un LLM la nivel de frontieră. xAI crede *cu adevărat* în asta. Pentru calcul, nici măcar la Google nu am experimentat niciodată acest # de cipuri pe cap de locuitor (& 100K+ GB200/300K's sunt primite cu Colossus 2). Pentru date, Grok 4 a făcut cel mai mare pariu în scalarea RL și posttraining. xAI face noi pariuri pentru a scala datele, gândirea profundă și rețeta de antrenament. Și echipa este rapidă. Nicio companie nu a ajuns unde se află astăzi xAI în capabilitățile AI în atât de puțin timp. După cum spune @elonmusk, instrumentele derivate de ordinul întâi și doi ale unei companii sunt cele mai importante: accelerația xAI este cea mai mare.
Sunt încântat să vă anunț că în primele mele săptămâni, am lansat Grok 4 Fast. Grok 4 este un model uimitor de raționament, încă cel mai bun pe ARC-AGI și noi benchmark-uri precum FinSearchComp. Dar este lent și nu a fost niciodată vizat cu adevărat pentru nevoile utilizatorilor de uz general. Grok 4 Fast este cel mai bun model de mini-clasă - pe LMArena, este #8 (Gemini 2.5 Flash este #18!), iar pe evaluări de raționament de bază precum AIME, este la egalitate cu Grok 4, în timp ce de 15 ori mai ieftin. S/o la @LiTianleli @jinyilll @ag_i_2211 @s_tworkowski @keirp1 @yuhu_ai_
3,28K
Limită superioară
Clasament
Favorite