Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 PRZEŁOM: Badacze Meta pokazali modelowi 2 miliony godzin wideo. Bez etykiet. Bez podręcznika fizyki. Bez jakiejkolwiek nadzoru.
Następnie pokazali mu klip, w którym obiekt znika za ścianą i nigdy się nie pojawia.
Model oznaczył to jako błąd. 🤯
Nauczył się trwałości obiektów. Spójności kształtów. Dynamiki kolizji. Całkowicie poprzez obserwację.
Co więcej, zaskakujące jest to, że nawet model trenowany przez zaledwie tydzień unikalnego wideo osiągnął wyniki powyżej losowych w wykrywaniu naruszeń fizyki. To nie jest przypadek. To zasada.
Kluczowy wniosek z pracy: to działa tylko wtedy, gdy model przewiduje w nauczonej przestrzeni reprezentacji, a nie w surowych pikselach. Model musi zbudować wewnętrzny model świata, skompresowany i abstrakcyjny, i przewidywać w oparciu o to. Przewidywanie w przestrzeni pikseli zawodzi. Multimodalne LLM, które rozumują przez tekst, zawodzą. Tylko architektura, która buduje abstrakcyjne reprezentacje podczas przewidywania brakujących danych sensorycznych, coś bliskiego temu, jak neurobiolodzy opisują kodowanie predykcyjne, rzeczywiście nabywa intuicję fizyczną.
Co oznacza, że podstawowa wiedza, którą badacze zakładali, że musi być wbudowana, może być po prostu obserwacją w skali. Niemowlęta uczą się trwałości obiektów, obserwując rzeczy. Okazuje się, że ta sama zasada ma tu zastosowanie.
A teraz oto część, o której nikt nie mówi.
Jeśli sama obserwacja uczy model reguł fizycznego świata, co się stanie, gdy zastosujesz tę samą zasadę do systemów produkcyjnych?
Produkcja ma również fizykę.
Nie grawitację. Ale zasady równie spójne: które wdrożenia powodują incydenty o 3 nad ranem, które kombinacje konfiguracji wchodzą w niebezpieczne interakcje, które ścieżki kodu cicho degradują pod obciążeniem, które zmiany usług powodują awarie dwa kroki dalej. Te wzorce są osadzone w tysiącach trajektorii. Wypychanie kodu, zmiany metryk, zgłoszenia klientów, harmonogramy incydentów. W dużej mierze nieobserwowane. Z pewnością nienazwane.
Nikt nie pisze podręcznika, który mówi: "jeśli usługa A wdraża z flagą X aktywną, a usługa B ma powyżej 70% CPU, latencja usługi C degraduje o 40% w ciągu 6 minut." Ale ten wzór istnieje. Jest powtarzalny. I siedzi w twoich danych o obserwowalności teraz, niewidoczny, ponieważ nikt nie zbudował modelu, aby go znaleźć.
To jest luka, którą @playerzeroai stara się wypełnić. Nie kolejny uruchamiacz testów. Nie kolejny próg alertu. Model świata produkcji, który uczy się, co się psuje z nagromadzonej obserwacji, w ten sam sposób, w jaki model Meta nauczył się grawitacji. Nie sprawdza twojego pokrycia testowego. Przewiduje trajektorie awarii.
Jeden tydzień wideo wystarczył, aby nauczyć się, że solidne obiekty nie przechodzą przez ściany.
Pytanie brzmi, ile obserwacji produkcji potrzebuje twój system, zanim model zacznie przewidywać, gdzie twój system się zepsuje następnie.
...

Najlepsze
Ranking
Ulubione
