Udostępniamy kod źródłowy Perception Encoder Audiovisual (PE-AV), technicznego silnika, który napędza nowoczesne separowanie dźwięku w SAM Audio. Zbudowany na naszym modelu Perception Encoder z początku tego roku, PE-AV integruje dźwięk z percepcją wizualną, osiągając nowoczesne wyniki w szerokim zakresie benchmarków audio i wideo. Jego natywne wsparcie multimodalne może pomóc ludziom w codziennych zadaniach, w tym w wykrywaniu dźwięku i bogatszym rozumieniu scen audio-wizualnych. 🔗 Przeczytaj artykuł: 🔗 Pobierz kod: