Uutta tutkimusta @Tsinghua_Uni:n kanssa: Spatial-TTT. Kehys visuaaliseen avaruuteen perustuvan avaruusälyn suoratoistoon testiaikakoulutuksella (TTT). Spatial-TTT mukauttaa nopeita painoja tallentaakseen ja järjestääkseen spatiaalista todistusaineistoa pitkistä videovirroista, mahdollistaen mallien rakenteellisen 3D-avaruusmuistin rakentamisen ajan myötä. Kohokohdat: 🔹Tehokas suoratoistomuisti. Nopeat painot toimivat kompaktina avaruusmuistina, joissa muisti kasvaa alilineaarisesti 7000+ ruudun aikana ja laskentateho on yli 40 % pienempi. 🔹Tilallinen ennustava mekanismi. TTT-kerrokset, joissa on 3D-spatiotemporaalinen konvoluutio, tallentavat geometrisen vastaavuuden ja ajallisen jatkuvuuden. 🔹SOTA-tulokset pitkän horisontin videospatiaalisesta ymmärryksestä (VSI-Bench). Lehti sijoittui sijalle #1 @huggingface Daily Papers -listalla 13. maaliskuuta. Projektisivu: GitHub: Artikkeli: Malli ja tiedot: