Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

swyx
Bereik ambitie met intentionaliteit, intensiteit en integriteit
- @smol_ai
- @dxtipshq
- @sveltesociety
- @aidotengineer
- @coding_career
- @latentspacepod
incredible work on alignment steganography from anthropic fellows
i've been looking for a straussian explanation of why china keeps publishing open models out of the goodness of their hearts
if you do stuff like use open models to, idk, clean *ahem* synthetically paraphrase your data to textbook quality you may very well import biases you can't detect until long after it's too late.
so if you want to export your value system to the rest of the world this is the most powerful Soft Power tool invented since Hollywood.
to be super clear we have no actual proof of this motivating any of the chinese labs. but this paper is a clear step towards a possible explanation.


Owain Evans23 jul, 00:06
Nieuw paper & verrassend resultaat.
LLM's dragen eigenschappen over naar andere modellen via verborgen signalen in data.
Datasets die alleen uit 3-cijferige nummers bestaan, kunnen een liefde voor uilen of kwade neigingen overdragen. 🧵

26,11K
gefeliciteerd aan Bee met het feit dat hij is opgepikt door Amazon; vergelijkbaar met Blink, Ring, Eero en natuurlijk de nieuwe Claude + Nova + Alexa, denk ik dat @panos_panay een behoorlijk solide tweede acte van Amazon's AI-hardwarestrategie aan het samenstellen is.
Ik wist dat Bee aan het winnen was toen @dharmesh opdook in zijn @latentspacepod met een.

12,33K
de reden waarom llm-analyse (en regulering, en PMing) moeilijk is*
is dat de relevante DIMENSIES blijven bewegen met elke generatie van grensmodellen; het is niet genoeg om gewoon je x- of y-as in logaritmische schaal te zetten en schalingwetten bij te houden, je moet echt het werk doen om na te denken over hoe modellen structureel verschillend zijn in 2025 versus 2024 versus 2023 en ga zo maar door.
eg
everyone focused on elo voor 2 jaar, elo wordt gemanipuleerd en verliest geloofwaardigheid.
everyone focused on prijs per tokens voor 3 jaar, redeneermodellen hebben 10-40x variatie in output tokens per taak, prijs per token verliest betekenis.
verzamel zoveel data als je wilt, maar als je alleen maar ongerepte tijdreeksen verzamelt, kun je het grotere geheel uit het oog verliezen.
*(en waarom uitspraken zoals “ai engineer is niet echt omdat alle software-engineers ai-engineers zijn” onzin zijn en nooit juist zullen zijn, behalve in de meest triviale zin)

Scott Huston22 jul, 08:30
Is er een openbare spreadsheet van alle toonaangevende LLM-modellen van verschillende bedrijven die hun prijzen, benchmark scores, arena elo-scores, enz. toont?
9,91K
swyx heeft opnieuw gepost
🆕 We brengen ons volledige RL + Redeneringstraject uit!
met:
• @willccbb, Prime Intellect
• @GregKamradt, Arc Prize
• @natolambert, AI2/Interconnects
• @corbtt, OpenPipe
• @achowdhery, Reflection
• @ryanmart3n, Bespoke
• @ChrSzegedy, Morph
met een speciale workshop van 3 uur van:
@danielhanchen van Unsloth!
begin hier:
Fijn weekend met kijken! en bedankt aan @OpenPipeAI voor het ondersteunen en hosten van dit traject!

106,66K
swyx heeft opnieuw gepost
als, zoals @sgrove voorstelt, specificaties de code van de toekomst zijn, wat is dan debugging?
1) specificatiecompilatie is het proces waarbij een coderingsagent specificaties omzet in code
2) steeds meer "compilatie" zal ongezien zijn, minder kijken naar de agent die diff voor diff werkt, meer specificatie in, code uit
3) typefouten -> waarheidsfouten: de meeste debugging zal bestaan uit het doorzoeken van onderzoek en implementatieplannen in markdown om de ene regel van onjuiste context te vinden die ervoor zorgt dat de coderingsagent niet slaagt bij de implementatie. Test suites zullen, naast andere dingen, controleren op waarheid en logische consistentie.
4) er is een nieuwe hogere orde variant van "een stap debugger aansluiten" die het kijken naar de agent omvat die een plan stap voor stap implementeert om de logische fout in de specificatie te pinpointen. Wanneer je een fout vindt tijdens het stap voor stap doorlopen van een programma, wijzig je de code, start je het proces opnieuw en herhaal je dit totdat het werkt. Wanneer je een fout vindt in een *specificatie* terwijl je door een implementatie stapt, ga je stroomopwaarts, fix je de specificatie en start je de *implementatie* opnieuw.
10,27K
we brengen elke dag een nummer uit van de @aidotengineer conferentie nu*. De RecSys track van gisteren was een groot succes - maar veruit de heetste track was onze dekking van de staat van MCP, gepresenteerd door @Calclavia
persoonlijke favoriete dia is deze waar ik me realiseerde dat @AnthropicAI MCP -veel- harder dogfoedt dan ik aanvankelijk dacht uit onze podcast met @dsp_ en @jspahrsummers
bekijk deze talks en geef je favoriete sprekers een shoutout!
*de meeste zijn al beschikbaar als "onvermeld" via de "Complete Playlist" als je zoekt

21,69K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste