*Utama* AI open source turun hari ini. Bisakah Amerika memenangkan perlombaan Open AI? Percakapan saya dengan @natolambert dan @soldni @allen_ai tentang peluncuran Olmo 3 00:00 – Terbuka Dingin 00:39 – Selamat datang & pengumuman besar hari ini 01:18 – Memperkenalkan keluarga model Olmo 3 02:07 – Apa sebenarnya "model dasar" (dan mengapa mereka penting) 05:51 – Dolma 3: data di balik Olmo 3 08:06 – Performa vs Qwen, Gemma, DeepSeek 10:28 – Apa arti open source sejati (dan mengapa jarang terjadi) 12:51 – Pos pemeriksaan perantara, transparansi, dan mengapa AI2 menerbitkan semuanya 16:37 – Mengapa Qwen ada di mana-mana (termasuk startup AS) 18:31 – Mengapa laboratorium Cina menjadi open source (dan mengapa laboratorium AS tidak) 20:28 – Di dalam ATOM: tanggapan AS terhadap lonjakan model China 22:13 – Munculnya "model berpikir" dan penskalaan waktu inferensi 35:58 – Pipa Olmo lengkap, dijelaskan secara sederhana 46:52 – Pra-pelatihan: data, skala, dan menghindari lonjakan bencana 50:27 – Pelatihan tengah (penambalan ekor) dan menghindari kebocoran tes 52:06 – Mengapa pelatihan konteks panjang itu penting 55:28 – SFT: membangun fondasi penalaran 1:04:53 – Penyetelan preferensi & mengapa DPO masih berfungsi 1:10:51 – Bagian yang sulit: RLVR, rantai penalaran yang panjang, dan nyeri infrastruktur 1:13:59 – Mengapa RL secara teknis begitu brutal 1:18:17 – Pajak kompleksitas vs hype AGI 1:21:58 – Bagaimana setiap orang dapat berkontribusi pada masa depan AI 1:27:26 – Penutup
... perlombaan AI **sumber terbuka**, d'oh 🤦 ♂️
33,55K