Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Modele świata w czasie rzeczywistym to najciekawszy rozwój w generatywnej AI w tej chwili, a prawie nikt na to nie zwraca uwagi.
Koncepcja: zamiast renderować stały klip wideo, AI generuje ciągłe środowisko, które reaguje na twoje wejście w miarę jego rozwoju. Mówisz, świat się zmienia. Dajesz kierunek, postacie reagują. Brak czekania, brak ponownego renderowania, brak stałego czasu trwania.
To różni się od wszystkiego innego w wideo AI. Sora generuje piękne 60-sekundowe klipy. Runway daje ci profesjonalną kontrolę nad edycją. Kling zajmuje się kinematograficzną pracą kamery. Wszystkie one produkują pliki, które oglądasz.
Modele świata w czasie rzeczywistym produkują przestrzenie, które zamieszkujesz.
Google DeepMind budowało to przez lata. Genie 1 udowodnił koncepcję. Genie 2 dodał środowiska 3D. Genie 3, wydany w sierpniu 2025 roku, osiągnął 720p przy 24 klatkach na sekundę z trwałością trwającą kilka minut. Ale DeepMind trzymało to w trybie podglądu badawczego, dostępnym tylko dla wybranych akademików i twórców.
PixVerse właśnie to zmieniło.
R1 zadebiutował 13 stycznia. Działa w twojej przeglądarce. Rozprowadzają kody zaproszeń i skalują się w kierunku otwartego dostępu. Specyfikacje techniczne odpowiadają lub przewyższają Genie 3: rozdzielczość 1080p, odpowiedź w czasie rzeczywistym, ciągła generacja.
Ich architektura ma trzy elementy, które warto zrozumieć. Model Omni łączy tekst, obraz, dźwięk i wideo w jeden strumień tokenów zamiast łańcuchować oddzielne systemy. Ramy autoregresywne umożliwiają teoretycznie nieograniczoną długość, przewidując każdą klatkę na podstawie tego, co było wcześniej. Silnik natychmiastowej odpowiedzi kompresuje próbkowanie z dziesiątek kroków do 1-4, co sprawia, że generacja w czasie rzeczywistym jest możliwa.
PixVerse ma także coś, czego nie ma DeepMind: dystrybucję. 100 milionów użytkowników. 40 milionów dolarów rocznych przychodów powtarzalnych. Alibaba prowadzi 60-milionową rundę B. Gdy R1 przekroczy tryb zaproszeń, jest gotowa publiczność do korzystania z tego.
Ograniczenia są realne. Przedłużone sekwencje gromadzą błędy prognozowania. Wierność fizyki jest wymieniana na szybkość. Spójność utrzymuje się przez minuty, a nie godziny. Te ograniczenia dotyczą również Genie 3. Rozwiązanie ich to prawdziwy wyścig.
Ale trajektoria ma większe znaczenie niż obecne ograniczenia. Przerwa między konsumowaniem treści a współtworzeniem jej się zamyka. PixVerse stawia na to, że mogą zrealizować tę przyszłość, zanim ktokolwiek inny dostarczy coś, czego ludzie naprawdę mogą dotknąć.
Najlepsze
Ranking
Ulubione
