*Великий* випуск відкритого ШІ сьогодні. Чи може Америка виграти гонку Open AI? Моя розмова з @natolambert і @soldni @allen_ai про запуск Olmo 3 00:00 – Холодне відкриття 00:39 – Ласкаво просимо та сьогоднішнє велике оголошення 01:18 – Представляємо сімейство моделей Olmo 3 02:07 – Що таке «базові моделі» насправді (і чому вони важливі) 05:51 – Долма 3: дані за Ольмо 3 08:06 – Виступ проти Qwen, Gemma, DeepSeek 10:28 – Що означає справжній відкритий код (і чому він рідкісний) 12:51 – Контрольні точки середнього рівня, прозорість і чому AI2 публікує все 16:37 – Чому Qwen всюди (включаючи американські стартапи) 18:31 – Чому китайські лабораторії переходять на відкритий код (і чому американські лабораторії ні) 20:28 – Inside ATOM: відповідь США на масове зростання моделей у Китаї 22:13 – Зростання «моделей мислення» та масштабування за часом висновку 35:58 – Повний конвеєр Олмо, пояснений просто 46:52 – Попереднє навчання: дані, масштабування та уникнення катастрофічних сплесків 50:27 – Середина тренування (латання хвоста) та уникнення протікання під час тесту 52:06 – Чому важливе навчання в довгому контексті 55:28 – SFT: закладання основи для мислення 1:04:53 – Налаштування преференцій і чому DPO досі працює 1:10:51 – Найскладніше: RLVR, довгі ланцюги мислення та біль у інфраструктурі 1:13:59 – Чому RL такий технічно жорсткий 1:18:17 – Податок складності проти ажіотажу навколо AGI 1:21:58 – Як кожен може зробити внесок у майбутнє ШІ 1:27:26 – Заключні думки
... відкритий **source** AI-гонка, чорт 🤦 ♂️ забирай
33,56K