DApp Store | Web3 Hub for hendelser og spill

Explore the Momentum ecosystem and earn $1.015M in rewards

Populære emner

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+11,1 %

Boopa−12,85 %

PORK−10,63 %

Tim Dettmers

Tim Dettmers12. aug., 20:08

Etter mitt syn er SWE-bench og T-bench de få benchmarkene som har et godt signal når det gjelder hvor mye fremgang vi gjør med modeller. Denne modellen yter like bra som Qwen3-koder og er bare 10 % dårligere enn GPT-5, samtidig som den er en generell LLM i stedet for kodespesialisert.

Z.ai11. aug., 11:43

Presenterer den tekniske rapporten for GLM-4.5! 👇 Dette arbeidet viser hvordan vi utviklet modeller som utmerker seg ved resonnement, koding og agentiske oppgaver gjennom et unikt treningsparadigme i flere trinn. Viktige innovasjoner inkluderer iterasjon av ekspertmodeller med selvdestillasjon for å forene evner, en hybrid resonneringsmodus for dynamisk problemløsning og en vanskelighetsbasert læreplan for forsterkende læring.

28,15K

Tim Dettmers lagt ut på nytt

Andrej Karpathy4. aug., 02:36

Dusj av tanker: I stedet for å beholde Twitter/X-utbetalingen din, rett den mot en "PayoutChallenge" etter eget valg - alt du vil ha mer av i verden! Her er min for denne runden, som kombinerer mine siste 3 utbetalinger på $5478.51: Det er viktig at menneskeheten ikke faller mens AI stiger opp. Menneskeheten må fortsette å heve seg, bli bedre ved siden av. Lag noe som er spesielt designet for å løfte teammennesket. Definisjonen ble med vilje litt vag for å holde litt entropi rundt folks tolkning, men imo-eksempler inkluderer: - Enhver programvare som hjelper til med forklaring, visualisering, memorering, inspirasjon, forståelse, koordinasjon, etc... - Det trenger ikke være for høyt, for eksempel kan det være en spesifikk pedagogisk artikkel/video som forklarer noe noen andre kan ha nytte av eller som du har unik kunnskap om. - Forespørsler/agenter for forklaring, for eksempel i tråd med nylig utgitt ChatGPT-studiemodus. - Beslektede kunstverk Denne utfordringen vil pågå i 2 uker frem til 17. Send inn bidraget ditt som svar. Det må være noe som ble unikt skapt for denne utfordringen og ellers ikke ville eksistert. Kriteriene inkluderer utførelse, innflytelse, nyhet, inspirasjon, estetikk, underholdning. Folk kan stemme opp bidrag ved å like, dette "folkets valg" vil også være en faktor. Jeg vil avgjøre vinneren 17 august og sende $ 5478.51 :)

676,36K

Tim Dettmers lagt ut på nytt

Akari Asai16. juli 2025

Noen oppdateringer 🚨 Jeg fullførte doktorgraden min ved @uwcse i juni 2025! Etter et år ved AI2 som forsker, begynner jeg i CMU @LTIatCMU & @mldcmu (høflighet) som assisterende professor høsten 2026. Reisen, anerkjennelser og rekruttering i 🧵

98,79K

Tim Dettmers lagt ut på nytt

Dan Alistarh14. juli 2025

Vi kunngjør vårt tidlige arbeid med FP4-slutning for LLM-er! - QuTLASS: kjernestøtte med lav presisjon for Blackwell GPUer - FP-Quant: en fleksibel kvantiseringssele for lama / Qwen Vi når 4x speedup vs BF16, med god nøyaktighet gjennom MXFP4 mikroskalering + smeltede Hadamard-rotasjoner.

22,55K

Tim Dettmers lagt ut på nytt

Albert Gu12. juli 2025

Tokenisering er bare et spesielt tilfelle av "chunking" - å bygge data på lavt nivå til abstraksjoner på høyt nivå - som igjen er grunnleggende for intelligens. Vår nye arkitektur, som muliggjør hierarkisk *dynamisk chunking*, er ikke bare tokeniseringsfri, men skalerer rett og slett bedre.

194,73K

Tim Dettmers lagt ut på nytt

Matej Sirovatka8. juli 2025

Det største datasettet med menneskelig skrevet GPU-kode med åpen kildekode? 👀 JA takk! Vi i @GPU_MODE har gitt ut rundt 40k 🚀 menneskelige skrevne kodeprøver som spenner over Triton, Hip og PyTorch, og alt er åpent på @huggingface Hub. Tren den nye GPT for å gjøre GPT-er raskere ⚡️ Lenke nedenfor ⬇️

28,87K

Tim Dettmers lagt ut på nytt

Albert Gu8. juli 2025

Jeg liker virkelig dette resultatet: en elegant innramming og løsning for å forbedre lengdegeneralisering betydelig i tilbakevendende modeller for øvrig (RNN-er/SSM-er/lineær oppmerksomhet/etc). Dette har betydelige implikasjoner for problemene arkitekturforskere bør fokusere på, IMO

13,06K

Tim Dettmers lagt ut på nytt

Julian Michael8. juli 2025

Jeg bør nok kunngjøre at jeg for noen måneder siden ble med i @scale_AI for å lede Safety, Evaluations, and Alignment Lab ... og i dag ble jeg med @Meta for å fortsette å jobbe med AI-tilpasning med @summeryue0 og @alexandr_wang. Veldig spent på hva vi kan oppnå sammen!

40,81K

Tim Dettmers lagt ut på nytt

Graham Neubig1. juli 2025

Hvordan vil programvareutvikling se ut i 2026? Med kodeagenter som raskt forbedres, kan utviklerroller se ganske annerledes ut. Min nåværende arbeidsflyt har endret seg mye: - Arbeid i github, ikke IDE-er - Agenter parallelt - Skriv engelsk, ikke kode - Mer kodegjennomgang Tanker + en video👇

15,62K

Tim Dettmers lagt ut på nytt

Aditya Kusupati27. juni 2025

📢Nå åpen, Gemma 3n vekter og den er naturlig fleksibel, den første i sitt slag, takket være MatFormer🪆 Enhver modell mellom E4B og E2B med NULL trening i nærheten av Pareto -- vi fant en haug! Finn en bedre E3B enn det vi ga ut, jeg sender deg en 🪆😉 Finn colab for ekstraksjon 🧵👇🪆

30,71K

Topp

Rangering

Favoritter

Trendende onchain

Trendende på X

Nylig toppfinansiering

Mest lagt merke til