Wir geben den Perception Encoder Audiovisual (PE-AV) als Open Source frei, die technische Engine, die SAM Audio bei der hochmodernen Audio-Trennung unterstützt. Basierend auf unserem Perception Encoder-Modell von Anfang dieses Jahres integriert PE-AV Audio mit visueller Wahrnehmung und erzielt hochmoderne Ergebnisse in einer Vielzahl von Audio- und Video-Benchmarks. Die native multimodale Unterstützung kann Menschen bei alltäglichen Aufgaben helfen, einschließlich Geräuscherkennung und einem reichhaltigeren Verständnis audiovisueller Szenen. 🔗 Lesen Sie das Papier: 🔗 Laden Sie den Code herunter: