Olemme avoimen lähdekoodin Perception Encoder Audiovisual (PE-AV), teknisen moottorin, joka auttaa edistämään SAM Audion huippuluokan äänierottelua. Perustuen aiemmin tänä vuonna julkaistuun Perception Encoder -malliimme, PE-AV yhdistää äänen ja visuaalisen havainnon, saavuttaen huipputason tuloksia laajalla ääni- ja videovertailujen kirjolla. Sen alkuperäinen multimodaalinen tuki voi auttaa ihmisiä arjen tehtävissä, kuten äänen tunnistuksessa ja rikkaammassa audiovisuaalisen ympäristön ymmärryksessä. 🔗 Lue artikkeli: 🔗 Lataa koodi: