🚨 BREAKING: Meta-forskere viste en modell med 2 millioner timer video. Ingen merkelapper. Ingen fysikkbok. Ingen tilsyn i det hele tatt. Så viste de det et klipp der en gjenstand forsvinner bak en vegg og aldri kommer tilbake. Modellen markerte det som feil. 🤯 Den hadde lært objektpermanens. Formkonsistens. Kollisjonsdynamikk. Helt av å se på. Det som er enda mer overraskende: selv en modell trent på bare én uke med unik video oppnådde over tilfeldige resultater på deteksjon av fysikkbrudd. Det er ikke en tilfeldighet. Det er et prinsipp. Hovedinnsikten fra artikkelen: dette fungerer bare når modellen predikerer i et lært representasjonsrom, ikke i rå piksler. Modellen må bygge en intern verdensmodell, komprimert og abstrakt, og forutsi mot den. Pikselromsprediksjon feiler. Multimodale LLM-er som resonnerer gjennom tekst feiler. Bare arkitekturen som bygger abstrakte representasjoner samtidig som den forutsier manglende sensorisk input, noe som ligner på hvordan nevrovitenskapsfolk beskriver prediktiv koding, får faktisk fysikkens intuisjon. Det betyr at kjernekunnskapen forskerne antok måtte være hardkodet, kanskje bare er observasjon i stor skala. Babyer lærer objektpermanens ved å observere ting. Det viser seg at samme prinsipp gjelder her. Nå kommer delen ingen snakker om. Hvis observasjon alene lærer en modell reglene i den fysiske verden, hva skjer når du anvender det samme prinsippet på produksjonssystemer? Produksjon har også fysikk. Ikke tyngdekraften. Men reglene er like konsistente: hvilke distribusjoner forårsaker hendelser klokken 03.00, hvilke konfigurasjonskombinasjoner samhandler farlig, hvilke kodestier som stille forringes under belastning, hvilke tjenesteendringer som forårsaker feil to hopp unna. Disse mønstrene er innebygd i tusenvis av baner. Kodepushing, metriske skift, kundehenvendelser, tidslinjer for hendelser. Stort sett uobservert. Definitivt uten merkelapper. Ingen skriver en runbook som sier «hvis tjeneste A deployeres med flagg X aktiv og tjeneste B er over 70 % CPU, forringes latenstiden på tjeneste C med 40 % innen 6 minutter.» Men det mønsteret eksisterer. Det er repeterbart. Og det ligger i observabilitetsdataene dine akkurat nå, usynlig fordi ingen har laget en modell for å finne det. Det er gapet @playerzeroai prøver å tette. Ikke enda en testløper. Ikke enda en alarmterskel. En produksjonsverdensmodell som lærer hvilke ting som går i stykker gjennom akkumulert observasjon, på samme måte som Metas modell lærte gravitasjon. Den sjekker ikke testdekningen din. Den forutsier feilbaner. En uke med video var nok til å lære at solide objekter ikke går gjennom vegger. Spørsmålet er hvor mye produksjonsobservasjon systemet ditt trenger før en modell begynner å forutsi hvor ditt vil gå i stykker neste gang. ...