*Významný* open source AI dnes propadá. Může Amerika vyhrát závod o otevřenou AI? Můj rozhovor s @natolambert a @soldni @allen_ai o spuštění Olmo 3 00:00 – Studený úvod 00:39 – Vítejte a dnešní velké oznámení 01:18 – Představujeme modelovou rodinu Olmo 3 02:07 – Co vlastně "základní modely" jsou (a proč jsou důležité) 05:51 – Dolma 3: data za Olmo 3 08:06 – Performance vs Qwen, Gemma, DeepSeek 10:28 – Co znamená pravý open source (a proč je vzácný) 12:51 – Mezilehlé kontrolní body, transparentnost a proč AI2 zveřejňuje všechno 16:37 – Proč je Qwen všude (včetně amerických startupů) 18:31 – Proč čínské laboratoře přecházejí na open source (a proč americké laboratoře ne) 20:28 – Inside ATOM: reakce USA na čínský nárůst modelů 22:13 – Vzestup "myšlenkových modelů" a škálování v době inference 35:58 – Celý Olmo pipeline, jednoduše vysvětlen 46:52 – Předtrénink: data, škálování a vyhýbání se katastrofickým výkyvům 50:27 – Střední trénink (záplata ocasu) a vyhýbání se únikům testů 52:06 – Proč je důležité dlouhodobé vzdělávání 55:28 – SFT: budování základů pro uvažování 1:04:53 – Nastavení preferencí a proč DPO stále funguje 1:10:51 – Těžká část: RLVR, dlouhé řetězce uvažování a bolest infrastruktury 1:13:59 – Proč je RL technicky tak brutální 1:18:17 – Daň ze složitosti vs reklama na AGI 1:21:58 – Jak může každý přispět k budoucnosti AI 1:27:26 – Závěrečné myšlenky
... otevřené **zdrojové** AI rasa, d'oh 🤦 ♂️
33,55K