Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Sean Ren 🔆
Budynek @SaharaLabsAI | Profesor @USCViterbi @nlp_usc | @MIT TR 35 , @ForbesUnder30 | Poprzednia: @allen_ai, @Snapchat, @Stanford, @UofIllinois
Użytkownik Sean Ren 🔆 udostępnił ponownie
LLM-y mogą wydawać się dobrze rozumieć, ale jeden błędny token może zniweczyć cały wynik. Nasza nowa praca pokazuje, że zapamiętywanie na poziomie tokenów jest kluczową przyczyną niepowodzeń, szczególnie w przypadku zmiany rozkładu.
Wprowadzenie: STIM 🔍🧠
🧵 #NLProc

1,84K
Cieszę się, że mogę wystąpić na Berkeley #SBC2025 #BASS2025 na temat zbieżności AI x Web3 i tego, jak moglibyśmy stworzyć otwartą, współpracującą gospodarkę dla przyszłości napędzanej przez AI.
Nasz lider produktu blockchain dzieli się architekturą technologiczną, jak osiągamy przepływy monetyzacji on-chain dla aktywów AI.
@BerkeleyRDI @StanfordSBA


7,78K
Użytkownik Sean Ren 🔆 udostępnił ponownie
W przyszłym tygodniu będę na @aclmeeting, aby zaprezentować tę pracę! 🇦🇹
Nie mogę się doczekać, aby poznać starych przyjaciół i nawiązać nowe. Nadróbmy zaległości, jeśli lubisz myśleć o przyszłości NLP skoncentrowanego na człowieku, personalizacji i wieloetapowych interakcji, czy po prostu chcesz napić się dobrej wiedeńskiej kawy ☕️
7,88K
Użytkownik Sean Ren 🔆 udostępnił ponownie
1+1=3
2+2=5
3+3=?
Wiele modeli językowych (np. Llama 3 8B, Mistral v0.1 7B) odpowie 7. Ale dlaczego?
Zagłębiamy się w wewnętrzne mechanizmy modelu, odkrywamy mechanizm indukcji funkcji i stwierdzamy, że jest on szeroko wykorzystywany, gdy modele napotykają niespodzianki podczas uczenia się w kontekście. 🧵

6,38K
Użytkownik Sean Ren 🔆 udostępnił ponownie
Platforma Usług Danych (DSP) jest AKTYWNA!
🔆 Teraz każdy, wszędzie na świecie, może przyczynić się do rozwoju AI i zarobić prawdziwe nagrody za swoją pracę.
🔆 Ponad 450 000 $ w nagrodach $SAHARA + nagrody od partnerów dostępne od pierwszego dnia!
Rozpocznij już dziś →
#AIdlaWSZYSTKICH

254,61K
Użytkownik Sean Ren 🔆 udostępnił ponownie
Jesteśmy @Zai_org zachwyceni oprogramowaniem open source GLM-4.1V-9B-Thinking, VLM, który może myśleć z długimi CoT. SoTA w <10B VLM, porównywalny z Qwen-2.5-VL-72B w 18 zadaniach. Jeden RL, który będzie rządził wszystkimi!
Szczegóły
- Raport techniczny:
-Kod:


2,99K
Użytkownik Sean Ren 🔆 udostępnił ponownie
Oto niedawne wystąpienie, które wygłosiłem, podsumowując ostatnie 6-12 miesięcy postępów w AI, dlaczego uzyskanie idealnych modeli jest trudne, jak laboratoria prawdopodobnie podchodzą do następnej fazy szkolenia (dla agentów) oraz inne interesujące informacje dotyczące krajobrazu rozumowania.
Tematy:
00:00 Wprowadzenie i stan rozumowania
05:50 Wspinaczka po niedoskonałych ocenach
09:18 Wąskie gardła techniczne
13:02 Sycophancy
18:08 Strefa Złotowłosej
19:28 Co dalej? (podpowiedź, planowanie)
26:40 Pytania i odpowiedzi
YouTube itd. w odpowiedziach.
Dzięki @corbtt i @OpenPipeAI za zaproszenie mnie.
67,89K
Użytkownik Sean Ren 🔆 udostępnił ponownie
Czy LLM-y potrafią odpowiednio wyjaśnić „Dlaczego niebo jest niebieskie?”
…dziesięciolatkowi 👶🏽 w porównaniu do kogoś z doktoratem z fizyki 👩🏽🔬?
W naszym artykule #ACL2025 oceniamy, jak dobrze LLM-y potrafią dostosować swoje wyjaśnienia do różnych osób.✍️
🔗
🧵 (1/n)

1,67K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi