Stiamo rendendo open source il Perception Encoder Audiovisual (PE-AV), il motore tecnico che aiuta a guidare la separazione audio all'avanguardia di SAM Audio. Costruito sul nostro modello Perception Encoder di inizio anno, PE-AV integra l'audio con la percezione visiva, raggiungendo risultati all'avanguardia in una vasta gamma di benchmark audio e video. Il suo supporto multimodale nativo può assistere le persone in compiti quotidiani, inclusa la rilevazione dei suoni e una comprensione più ricca delle scene audio-visive. 🔗 Leggi il documento: 🔗 Scarica il codice: