Vi öppnar Perception Encoder Audiovisual (PE-AV), den tekniska motorn som hjälper till att driva SAM Audios toppmoderna ljudseparation. Byggd på vår Perception Encoder-modell från tidigare i år integrerar PE-AV ljud med visuell perception och uppnår toppmoderna resultat över ett brett spektrum av ljud- och videobenchmarks. Dess inbyggda multimodala stöd kan hjälpa människor i vardagliga uppgifter, inklusive ljuddetektering och en rikare förståelse av ljud- och bildmiljöer. 🔗 Läs artikeln: 🔗 Ladda ner koden: