*Główne* otwarte źródło AI dzisiaj. Czy Ameryka może wygrać wyścig Open AI? Moja rozmowa z @natolambert i @soldni z @allen_ai na temat uruchomienia Olmo 3 00:00 – Zimne otwarcie 00:39 – Powitanie i dzisiejsze wielkie ogłoszenie 01:18 – Wprowadzenie do rodziny modeli Olmo 3 02:07 – Czym naprawdę są „modele bazowe” (i dlaczego są ważne) 05:51 – Dolma 3: dane stojące za Olmo 3 08:06 – Wydajność w porównaniu do Qwen, Gemma, DeepSeek 10:28 – Co oznacza prawdziwe otwarte źródło (i dlaczego jest rzadkie) 12:51 – Pośrednie punkty kontrolne, przejrzystość i dlaczego AI2 publikuje wszystko 16:37 – Dlaczego Qwen jest wszędzie (w tym w amerykańskich startupach) 18:31 – Dlaczego chińskie laboratoria przechodzą na otwarte źródło (i dlaczego amerykańskie laboratoria tego nie robią) 20:28 – Wewnątrz ATOM: amerykańska odpowiedź na wzrost modeli w Chinach 22:13 – Wzrost „myślących modeli” i skalowanie w czasie wnioskowania 35:58 – Pełny proces Olmo, wyjaśniony w prosty sposób 46:52 – Wstępne szkolenie: dane, skala i unikanie katastrofalnych skoków 50:27 – Średnie szkolenie (łatka ogonowa) i unikanie wycieku testów 52:06 – Dlaczego szkolenie z długim kontekstem ma znaczenie 55:28 – SFT: budowanie fundamentów dla rozumowania 1:04:53 – Dostosowywanie preferencji i dlaczego DPO wciąż działa 1:10:51 – Trudna część: RLVR, długie łańcuchy rozumowania i ból infrastruktury 1:13:59 – Dlaczego RL jest tak technicznie brutalne 1:18:17 – Podatek od złożoności a hype AGI 1:21:58 – Jak każdy może przyczynić się do przyszłości AI 1:27:26 – Zakończenie myśli
... otwarty **źródłowy** wyścig AI, d'oh 🤦‍♂️
33,57K