Dziś uruchamiamy Fundusz Inżynierów OSS ElevenLabs - program, który zapewnia stałe wsparcie dla projektów open-source, które wspierają naszą pracę.
W ciągu najbliższych sześciu miesięcy przeznaczymy 22 000 dolarów na projekty, na których polegają nasi inżynierowie.
Przedstawiamy, otwarty szablon do nadawania transkryptów w czasie rzeczywistym.
• Generuj na żywo transkrypty za pomocą Scribe
• Nadaj do wielu odbiorców korzystając z Supabase
• Tłumacz za pomocą wbudowanej AI w Chrome
Demo i otwarty szablon poniżej.
Nadaj swoim agentom głosowym twarz z @DecartAI
• ElevenLabs generuje strumień mowy
• Decart animuje awatara wideo w czasie rzeczywistym z synchronizacją ruchu warg
• Pipecat orkiestruje pipeline i obsługuje transport WebRTC
Kod demonstracyjny open-source poniżej.
Nowa aktualizacja: Decart Lip Sync API.
Synchronizacja ruchu warg w czasie rzeczywistym dla każdego awatara.
Przesyłaj dźwięk → uzyskaj idealnie zsynchronizowane klatki wideo z niskim opóźnieniem.
Bez dziwnego opóźnienia. Bez wstępnego renderowania. Tylko żywe piksele, które poruszają się, gdy twój model mówi. 🧵