Deschidem Perception Encoder Audiovisual (PE-AV), motorul tehnic care ajută la dezvoltarea separării audio de ultimă generație a SAM Audio. Construit pe modelul nostru Perception Encoder de la începutul acestui an, PE-AV integrează sunetul cu percepția vizuală, obținând rezultate de ultimă generație într-o gamă largă de benchmark-uri audio și video. Suportul său multimodal nativ poate ajuta oamenii în activități cotidiene, inclusiv detectarea sunetului și o înțelegere mai bogată a scenelor audio-vizuale. 🔗 Citește ziarul: 🔗 Descarcă codul: