*Stort* åpen kildekode-AI-lansering i dag. Kan Amerika vinne Open AI-løpet? Min samtale med @natolambert og @soldni av @allen_ai om lanseringen av Olmo 3 00:00 – Cold Open 00:39 – Velkommen og dagens store kunngjøring 01:18 – Introduksjon av Olmo 3-modellfamilien 02:07 – Hva «basismodeller» egentlig er (og hvorfor de er viktige) 05:51 – Dolma 3: dataene bak Olmo 3 08:06 – Opptreden mot Qwen, Gemma, DeepSeek 10:28 – Hva ekte åpen kildekode betyr (og hvorfor det er sjelden) 12:51 – Mellomliggende sjekkpunkter, åpenhet, og hvorfor AI2 publiserer alt 16:37 – Hvorfor Qwen er overalt (inkludert amerikanske oppstartsbedrifter) 18:31 – Hvorfor kinesiske laboratorier blir åpen kildekode (og hvorfor amerikanske laboratorier ikke gjør det) 20:28 – Inside ATOM: USAs respons på Kinas modelloppsving 22:13 – Fremveksten av «tenkende modeller» og skalering i slutningstid 35:58 – Hele Olmo-rørledningen, enkelt forklart 46:52 – Forhåndstrening: data, skalering og unngåelse av katastrofale topper 50:27 – Midttrening (halelapping) og unngåelse av testlekkasje 52:06 – Hvorfor lang-kontekst-trening er viktig 55:28 – SFT: å bygge grunnlaget for resonnement 1:04:53 – Preferansestemming og hvorfor DPO fortsatt fungerer 1:10:51 – Den vanskelige delen: RLVR, lange resonnementskjeder og infrastruktursmerte 1:13:59 – Hvorfor RL er så teknisk brutalt 1:18:17 – Kompleksitetsskatt vs AGI-hype 1:21:58 – Hvordan alle kan bidra til AI-fremtiden 1:27:26 – Avslutningstanker
... åpen **kildekode** AI-rase, d'oh 🤦 ♂️
33,55K