PixVerse-R1'e erken erişim sağladım, gerçek zamanlı bir dünya modeli. Bu oldukça umut verici! R1 temelde farklı bir paradigmadır: Sabit klipler oluşturmak yerine, kullanıcı girdisine anında yanıt veren sonsuz, kesintisiz görsel akışlar yaratır. (Davetiye kodları aşağıda)
Platform, videoları belirgin şekilde hızlı üretiyor! Bir kliple başlayabilir ve ona yeni sahneler ekleyebilirsiniz. Model, ilerledikçe tutarlılığı korur. Çoğu video aracı size bir klip verir ve baştan başlarsınız. Bu daha çok zaten hareket halinde olan bir şeyi yönlendiriyormuş gibi hissettiriyor.
@PixVerse_'ın modelinin mimarisi üç kritik parçadan oluşur: 1. Metin, görüntü, video ve sesi tek bir token akışında birleştiren yerel çok modlu bir temel model. 2. Süresiz uzun diziler arasında tutarlılığı koruyan otoregressif bellek mekanizması. 3. Örnekleme adımlarını onlarcadan 1'den 4'e indiren "Anında Yanıt Motoru". Son kısım anahtar: bu modelin gerçek zamanlı çalışmasını sağlayan şey budur.
Modelin tam olarak aklınızda olan şeyi üretmesini sağlamak hâlâ zordur. Belirli bir hikayeyi gerçekleştirmek için birden fazla deneme gerekir. Bu, genel olarak video üretiminde bir sorundur. Hollywood'un yerini almaya hâlâ çok uzaktayız.
Gerçek zamanlı video üretiminde birkaç sınırlama vardır: 1. Küçük tahmin hataları genişletilmiş dizilerde birikiyor 2. Hesaplama maliyetleri yüksek (ve hâlâ bir dar boğaz) Erken geldik ama buradaki gidişat oldukça iyi görünüyor!
Gelecek gerçekten parlak: • Oynadıkça ortamları oluşturan bir oyun. %100 anlık. • İzleyicinin anlatı sonuçlarını etkilediği bir film. • Araştırma, endüstriyel planlama ve hatta kararlara dayalı olarak gelişen ekolojik modelleme için simülasyonlar. Buradaki amaç bu: "Sınırlı medya eserleri yerine sürekli, etkileşimli dünyalara" sahip olmak.
267