Nova pesquisa com @Tsinghua_Uni: Spatial-TTT. Uma estrutura para streaming de inteligência espacial baseada em visualização com treinamento em tempo de teste (TTT). Spatial-TTT adapta pesos rápidos para capturar e organizar evidências espaciais de longas transmissões de vídeo, permitindo que os modelos construam uma memória espacial 3D estruturada ao longo do tempo. Destaques: 🔹Memória de streaming eficiente. Pesos rápidos atuam como memória espacial compacta com crescimento de memória sublinear ao longo de mais de 7000 quadros e mais de 40% de redução no cálculo. 🔹Mecanismo preditivo espacial. Camadas TTT com convolução espaço-temporal 3D capturam correspondência geométrica e continuidade temporal. 🔹Resultados SOTA na compreensão espacial de vídeo de longo prazo (VSI-Bench). O artigo ficou em #1 no @huggingface Daily Papers em 13 de março. Página do projeto: GitHub: Artigo: Modelo e Dados: