Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tim Dettmers
Etter mitt syn er SWE-bench og T-bench de få benchmarkene som har et godt signal når det gjelder hvor mye fremgang vi gjør med modeller. Denne modellen yter like bra som Qwen3-koder og er bare 10 % dårligere enn GPT-5, samtidig som den er en generell LLM i stedet for kodespesialisert.

Z.ai11. aug., 11:43
Presenterer den tekniske rapporten for GLM-4.5! 👇
Dette arbeidet viser hvordan vi utviklet modeller som utmerker seg ved resonnement, koding og agentiske oppgaver gjennom et unikt treningsparadigme i flere trinn.
Viktige innovasjoner inkluderer iterasjon av ekspertmodeller med selvdestillasjon for å forene evner, en hybrid resonneringsmodus for dynamisk problemløsning og en vanskelighetsbasert læreplan for forsterkende læring.

28,15K
Tim Dettmers lagt ut på nytt
Dusj av tanker: I stedet for å beholde Twitter/X-utbetalingen din, rett den mot en "PayoutChallenge" etter eget valg - alt du vil ha mer av i verden!
Her er min for denne runden, som kombinerer mine siste 3 utbetalinger på $5478.51:
Det er viktig at menneskeheten ikke faller mens AI stiger opp. Menneskeheten må fortsette å heve seg, bli bedre ved siden av. Lag noe som er spesielt designet for å løfte teammennesket. Definisjonen ble med vilje litt vag for å holde litt entropi rundt folks tolkning, men imo-eksempler inkluderer:
- Enhver programvare som hjelper til med forklaring, visualisering, memorering, inspirasjon, forståelse, koordinasjon, etc...
- Det trenger ikke være for høyt, for eksempel kan det være en spesifikk pedagogisk artikkel/video som forklarer noe noen andre kan ha nytte av eller som du har unik kunnskap om.
- Forespørsler/agenter for forklaring, for eksempel i tråd med nylig utgitt ChatGPT-studiemodus.
- Beslektede kunstverk
Denne utfordringen vil pågå i 2 uker frem til 17. Send inn bidraget ditt som svar. Det må være noe som ble unikt skapt for denne utfordringen og ellers ikke ville eksistert. Kriteriene inkluderer utførelse, innflytelse, nyhet, inspirasjon, estetikk, underholdning. Folk kan stemme opp bidrag ved å like, dette "folkets valg" vil også være en faktor. Jeg vil avgjøre vinneren 17 august og sende $ 5478.51 :)
676,36K
Tim Dettmers lagt ut på nytt
Vi kunngjør vårt tidlige arbeid med FP4-slutning for LLM-er!
- QuTLASS: kjernestøtte med lav presisjon for Blackwell GPUer
- FP-Quant: en fleksibel kvantiseringssele for lama / Qwen
Vi når 4x speedup vs BF16, med god nøyaktighet gjennom MXFP4 mikroskalering + smeltede Hadamard-rotasjoner.


22,55K
Tim Dettmers lagt ut på nytt
Tokenisering er bare et spesielt tilfelle av "chunking" - å bygge data på lavt nivå til abstraksjoner på høyt nivå - som igjen er grunnleggende for intelligens.
Vår nye arkitektur, som muliggjør hierarkisk *dynamisk chunking*, er ikke bare tokeniseringsfri, men skalerer rett og slett bedre.

194,73K
Tim Dettmers lagt ut på nytt
Det største datasettet med menneskelig skrevet GPU-kode med åpen kildekode? 👀 JA takk! Vi i @GPU_MODE har gitt ut rundt 40k 🚀 menneskelige skrevne kodeprøver som spenner over Triton, Hip og PyTorch, og alt er åpent på @huggingface Hub. Tren den nye GPT for å gjøre GPT-er raskere ⚡️
Lenke nedenfor ⬇️
28,87K
Tim Dettmers lagt ut på nytt
Jeg liker virkelig dette resultatet: en elegant innramming og løsning for å forbedre lengdegeneralisering betydelig i tilbakevendende modeller for øvrig (RNN-er/SSM-er/lineær oppmerksomhet/etc).
Dette har betydelige implikasjoner for problemene arkitekturforskere bør fokusere på, IMO
13,06K
Tim Dettmers lagt ut på nytt
Jeg bør nok kunngjøre at jeg for noen måneder siden ble med i @scale_AI for å lede Safety, Evaluations, and Alignment Lab ... og i dag ble jeg med @Meta for å fortsette å jobbe med AI-tilpasning med @summeryue0 og @alexandr_wang. Veldig spent på hva vi kan oppnå sammen!
40,81K
Tim Dettmers lagt ut på nytt
Hvordan vil programvareutvikling se ut i 2026?
Med kodeagenter som raskt forbedres, kan utviklerroller se ganske annerledes ut. Min nåværende arbeidsflyt har endret seg mye:
- Arbeid i github, ikke IDE-er
- Agenter parallelt
- Skriv engelsk, ikke kode
- Mer kodegjennomgang
Tanker + en video👇
15,62K
Tim Dettmers lagt ut på nytt
📢Nå åpen, Gemma 3n vekter og den er naturlig fleksibel, den første i sitt slag, takket være MatFormer🪆
Enhver modell mellom E4B og E2B med NULL trening i nærheten av Pareto -- vi fant en haug!
Finn en bedre E3B enn det vi ga ut, jeg sender deg en 🪆😉
Finn colab for ekstraksjon 🧵👇🪆

30,71K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til