*Belangrijk* open source AI-nieuws vandaag. Kan Amerika de Open AI-race winnen? Mijn gesprek met @natolambert en @soldni van @allen_ai over de lancering van Olmo 3 00:00 – Koude Open 00:39 – Welkom & de grote aankondiging van vandaag 01:18 – Introductie van de Olmo 3 modelfamilie 02:07 – Wat "basis modellen" echt zijn (en waarom ze belangrijk zijn) 05:51 – Dolma 3: de data achter Olmo 3 08:06 – Prestaties vs Qwen, Gemma, DeepSeek 10:28 – Wat echte open source betekent (en waarom het zeldzaam is) 12:51 – Tussentijdse checkpoints, transparantie, en waarom AI2 alles publiceert 16:37 – Waarom Qwen overal is (inclusief Amerikaanse startups) 18:31 – Waarom Chinese laboratoria open source gaan (en waarom Amerikaanse laboratoria dat niet doen) 20:28 – Binnen ATOM: de Amerikaanse reactie op de modelgolf uit China 22:13 – De opkomst van "denkende modellen" en inferentietijd-schaalvergroting 35:58 – De volledige Olmo-pijplijn, eenvoudig uitgelegd 46:52 – Voortraining: data, schaal, en het vermijden van catastrofale pieken 50:27 – Midden-training (tail patching) en het vermijden van testlekken 52:06 – Waarom training met lange context belangrijk is 55:28 – SFT: de basis leggen voor redeneren 1:04:53 – Voorkeurstuning & waarom DPO nog steeds werkt 1:10:51 – Het moeilijke deel: RLVR, lange redeneerketens, en infrastructuurproblemen 1:13:59 – Waarom RL zo technisch zwaar is 1:18:17 – Complexiteitstaks vs AGI-hype 1:21:58 – Hoe iedereen kan bijdragen aan de toekomst van AI 1:27:26 – Afsluitende gedachten
... open **source** AI-race, d'oh 🤦‍♂️
33,59K