Nous open-sourçons le Perception Encoder Audiovisual (PE-AV), le moteur technique qui aide à propulser la séparation audio de pointe de SAM Audio. Construit sur notre modèle Perception Encoder de début d'année, le PE-AV intègre l'audio avec la perception visuelle, atteignant des résultats de pointe dans une large gamme de benchmarks audio et vidéo. Son support multimodal natif peut aider les gens dans les tâches quotidiennes, y compris la détection de sons et une compréhension plus riche des scènes audio-visuelles. 🔗 Lisez l'article : 🔗 Téléchargez le code :