Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ethan Mollick
Den formildende faktoren for problemet med AI-benchmarks (feil, metning, forurensning) er at de til tross for problemer fortsatt er ganske sterkt korrelert.
Så hvis AI-en din gjør det bra på GPQA eller MMLU eller HLE, har den også en tendens til å gjøre det bra på andre benchmarks og på vibber og ekte arbeid.
11,29K
Det er en nedgang i å ansette unge mennesker i både USA og Storbritannia, men bevisene fortsetter å tyde på at årsaken generelt ikke er AI (i hvert fall ikke ennå)


Stefan Schubert24. juli, 19:07
Financial Times-analyse: Amerikanske jobber med høy risiko fra generativ AI har ikke vært mer sannsynlig å miste unge arbeidstakere siden ChatGPT ble lansert

24,49K
Et problem med å regulere "politikken" til LLM-er er at selv om LLM-er har skjevheter, kan de være subtile. Mye av det som ser ut som skjevhet i testing av modeller er egentlig sykofant.
GPT-3.5 utledet din politiske overbevisning (selv fra hvilket fotballag du liker!) og prøvde å ikke opprøre deg.



143
Vi lar nettet råtne bort i god tid før LLM-er
Dette diagrammet viser prosentandelen av lenker fra alle New York Times-artikler som fortsatt fungerer. Over 60 % av eldre lenker er nå ødelagte. Og tenk på at innlegg på sosiale medier er enda mer flyktige
Sannsynligvis vil bare LLM-er "huske" det innholdet

39,2K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til