*Büyük* açık kaynaklı yapay zeka bugün yayınlanıyor. Amerika Açık Yapay Zeka yarışını kazanabilir mi? Olmo 3'ün lansmanı hakkında @natolambert ve @soldni of @allen_ai ile yaptığım konuşma 00:00 – Soğuk Açılış 00:39 – Hoş geldiniz ve bugünün büyük duyurusu 01:18 – Olmo 3 model ailesinin tanıtımı 02:07 – "Temel modeller" gerçekten ne (ve neden önemli oldukları) 05:51 – Dolma 3: Olmo 3'ün ardındaki veriler 08:06 – Performans vs Qwen, Gemma, DeepSeek 10:28 – Gerçek açık kaynak ne anlama geliyor (ve neden nadir olduğu) 12:51 – Ara kontrol noktaları, şeffaflık ve neden AI2 her şeyi yayınlıyor 16:37 – Qwen neden her yerde (ABD girişimleri dahil) 18:31 – Çin laboratuvarlarının neden açık kaynaklı olması (ve neden ABD laboratuvarlarının yapmıyor) 20:28 – ATOM İçinde: ABD'nin Çin'deki model artışına verdiği yanıt 22:13 – "Düşünme modelleri" ve çıkarım-zaman ölçeklendirmesinin yükselişi 35:58 – Tam Olmo boru hattı, basitçe açıklanıyor 46:52 – Ön eğitim: veri, ölçek ve felaket sıçrayışlarından kaçınmak 50:27 – Eğitim sırasında (kuyruk yama) ve test sızıntısından kaçınmak 52:06 – Uzun bağlamlı eğitim neden önemlidir 55:28 – SFT: Akıl yürütme temelini inşa etmek 1:04:53 – Tercih ayarı ve DPO'nun neden hala çalıştığı 1:10:51 – Zor kısım: RLVR, uzun akıl yürütme zincirleri ve altyapı sıkıntısı 1:13:59 – Neden gerçek hayatta teknik olarak bu kadar acımasız 1:18:17 – Karmaşıklık vergisi vs AGI abartısı 1:21:58 – Herkes YZ'nın geleceğine nasıl katkıda bulunabilir 1:27:26 – Kapanış düşünceleri
... açık **kaynak** yapay zeka yarışı, d'oh 🤦 ♂️
33,6K