Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Hugging Face
Użytkownik Hugging Face udostępnił ponownie
Wydaliśmy nasz model TTS oparty na LFM2-350M jako open source 🚀 Wydaliśmy również wiele różnych modeli FT.
Platforma GPU: @hyperbolic_labs
Dane: Emilia + Emilia Yodas(EN)
Model LLM: LFM2-350M @LiquidAI_
Dysk i przestrzeń: @huggingface
Bardzo się cieszę, że mogłem wydać ten model jako open source. Wielkie dzięki dla @VyvoSmartChain
#opensource #speech #tts #huggingface #lfm #gpu
29,25K
Użytkownik Hugging Face udostępnił ponownie
🚨 Wielkie wieści! Zdecydowaliśmy, że biblioteka po treningu @huggingface, TRL, będzie natywnie wspierać trening modeli językowo-wizualnych 🖼️
To buduje na naszym niedawnym wsparciu dla VLM w SFTTrainer — i nie zamierzamy się zatrzymywać, dopóki TRL nie stanie się biblioteką nr 1 do treningu VLM 🥇
Więcej tutaj 👉
Ogromne podziękowania dla @mervenoyann, @SergioPaniego i @ariG23498 🔥

27,3K
270 milionów (nie miliardów) parametrów! ⚡️⚡️⚡️

Omar Sanseviero15 sie, 00:04
Przedstawiamy Gemma 3 270M 🔥
🤏 Mały model! Tylko 270 milionów parametrów
🧠 Bardzo silne śledzenie instrukcji
🤖 Dostosowanie w zaledwie kilka minut, z dużym słownictwem, aby stanowić wysokiej jakości fundament

37,95K
Użytkownik Hugging Face udostępnił ponownie
Przedstawiamy DINOv3: nowoczesny model wizji komputerowej wytrenowany z wykorzystaniem uczenia samonadzorowanego (SSL), który generuje potężne, wysokiej rozdzielczości cechy obrazów. Po raz pierwszy pojedynczy zamrożony szkielet wizji przewyższa wyspecjalizowane rozwiązania w wielu długotrwałych zadaniach gęstego przewidywania.
Dowiedz się więcej o DINOv3 tutaj:
192
Użytkownik Hugging Face udostępnił ponownie
Bardzo interesujący zbiór danych dotyczących potraw, jeśli budujesz aplikację/model zdrowotny: 100 tys. starannie wyselekcjonowanych próbek jedzenia obejmujących domowe posiłki, dania restauracyjne, surowe składniki i produkty pakowane.
Sposób, w jaki został zbudowany, jest równie cenny
• 50 tys. prawdziwych użytkowników na Binance uchwyciło swoje talerze, a następnie wstępnie oznaczone przez profesjonalnych annotatorów.
• Etykiety generowane przez maszyny zostały następnie sprawdzone i udoskonalone przez użytkowników Biance, aby zapewnić jakość.
• Część zbioru danych udostępniona na Hugging Face na licencji OpenRail.
Brzmi jak nowe podejście do zbierania danych w sposób crowdsourcingowy.
Link poniżej:

71,32K
Użytkownik Hugging Face udostępnił ponownie
🚀Z radością ogłaszamy, że Hunyuan-GameCraft, framework do generacji interaktywnych filmów wideo o wysokiej dynamice, oparty na HunyuanVideo, jest teraz dostępny jako open-source.
Generuje grywalne i fizycznie realistyczne filmy wideo z pojedynczego obrazu sceny oraz sygnałów akcji użytkownika, umożliwiając twórcom i deweloperom "reżyserowanie" gier z perspektywy pierwszej lub trzeciej osoby.
Kluczowe zalety:
🔹Wysoka dynamika: Ujednolica standardowe wejścia z klawiatury w wspólną, ciągłą przestrzeń akcji, umożliwiając precyzyjną kontrolę nad prędkością i kątem. To pozwala na eksplorację złożonych trajektorii, pokonując sztywne, ograniczone ruchy tradycyjnych modeli. Może również generować dynamiczne treści środowiskowe, takie jak poruszające się chmury, deszcz, śnieg i przepływ wody.
🔹Długoterminowa spójność: Używa hybrydowego warunku historycznego, aby zachować oryginalne informacje o scenie po znacznym ruchu.
🔹Znacząca redukcja kosztów: Nie ma potrzeby kosztownego modelowania/renderowania. Destylacja PCM kompresuje kroki wnioskowania, zwiększając prędkość i obniżając koszty. To pozwala na uruchomienie skwantyzowanego modelu 13B na konsumenckich GPU, takich jak RTX 4090.
Strona projektu:
Kod:
Raport techniczny:
Hugging Face:
152,87K
Użytkownik Hugging Face udostępnił ponownie
OpenAI gpt-oss 120B organizuje pełne wideo za pomocą Hugging Face spaces! 🤯
Wszystko to w jednym JEDNYM poleceniu:
stwórz obraz Labradora i użyj go do wygenerowania prostego wideo z nim
🛠️ Użyte narzędzia:
1. Flux.1 Krea Dev od @bfl_ml
2. LTX Fast od @Lightricks
To wszystko, gpt-oss 120B to jeden z NAJLEPSZYCH modeli open source, jakich używałem do wywoływania narzędzi do tej pory! Brawo @OpenAI 🤗
43,66K
Użytkownik Hugging Face udostępnił ponownie
przedstawiamy qqWen: nasz całkowicie otwarty projekt (kod + wagi + dane + szczegółowy raport techniczny) do pełnego dostrajania (pretraining + SFT + RL) seria modeli (1.5b, 3b, 7b, 14b i 32b) dla niszowego języka programowania finansowego o nazwie Q
Wszystkie szczegóły poniżej!


102,51K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi