Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Dyrektor ds. robotyki NVIDIA i wybitny naukowiec. Współprowadzący laboratorium GEAR. Rozwiązywanie fizycznego AGI, jeden silnik na raz. Doktorat Stanforda, pierwszy stażysta OpenAI.
Było coś głęboko satysfakcjonującego w ImageNet. Miał dobrze dobrany zbiór treningowy. Wyraźnie zdefiniowany protokół testowy. Konkurs, który zjednoczył najlepszych badaczy. I tabela wyników, która zrodziła ResNety i ViTy, a ostatecznie na zawsze zmieniła tę dziedzinę.
Potem przyszło NLP. Niezależnie od tego, jak bardzo OpenAI, Anthropic i xAI się nie zgadzają, przynajmniej w jednej kwestii się zgadzają: benchmarking. MMLU, HLE, SWEBench - nie możesz poczynić postępów, dopóki nie będziesz w stanie tego zmierzyć.
Robotyka wciąż nie ma takiego wezwania do działania. Nikt się w niczym nie zgadza: sprzęt, zadanie, ocena, silnik symulacyjny czy rzeczywiste środowisko. Każdy jest SOTA, z definicji, w benchmarku, który definiuje na bieżąco dla każdego artykułu.
Od twórcy ImageNet - BEHAVIOR podejmuje się trudnego wyzwania zjednoczenia benchmarkingu robotyki na reprodukowalnym silniku fizycznym (Isaac Sim). Projekt rozpoczął się zanim ukończyłem Stanford Vision Lab i wymagał wielu lat poświęcenia oraz karier doktoranckich, aby go zbudować. Mam nadzieję, że BEHAVIOR jest albo sygnałem do wspinania się na wzgórze, którego potrzebujemy, albo iskrą, która w końcu skłoni nas do rozmowy o tym, jak mierzyć rzeczywisty postęp w tej dziedzinie.

Fei-Fei Li3 wrz, 04:10
(1/N) How close are we to enabling robots to solve the long-horizon, complex tasks that matter in everyday life?
🚨 We are thrilled to invite you to join the 1st BEHAVIOR Challenge @NeurIPS 2025, submission deadline: 11/15.
🏆 Prizes:
🥇 $1,000
🥈 $500
🥉 $300
499
Vibe Minecraft: wieloosobowy, spójny model świata w czasie rzeczywistym, który pozwala na budowanie czegokolwiek i przywoływanie dowolnych obiektów. Funkcje narzędzi, a nawet same mechaniki gry mogą być programowane w języku naturalnym, takim jak "chrono-pickaxe: przywróć dowolny blok do poprzedniego stanu w czasie" oraz "wodospady zamieniają się w tęczowy most, gdy przechodzą obok jednorożce". Gracze wspólnie definiują i manipulują współdzielonym światem.
Neural sim przyjmuje jako wejście *multimodalny* systemowy prompt: zasady gry, assety png, globalną mapę i easter eggi. Okresowo zapisuje stany gry jako sekwencję wektorów latentnych, które można załadować z powrotem do kontekstu, opcjonalnie z przeplatanymi "tekstami przewodnimi", aby umożliwić łatwą edycję. Każdy gracz ma swój własny jawny stat json (zdrowie, ekwipunek, współrzędne 3D) oraz niejawne "wektory gracza", które uchwycają historię interakcji wyższego rzędu.
Administratorzy gry mogą stworzyć multiversum Minecraft, ponieważ latenty są kompatybilne z różnych serwerów. Każdy świat może płynnie łączyć się z innym, aby w kilka sekund tworzyć nowe światy. Ludzie mogą łączyć i dopasowywać ze stanami swoich przyjaciół lub swoimi własnymi przeszłymi stanami. "Rzadkie wektory" mogą się pojawić, gdy niektórzy gracze nieuchronnie wędrują w dziwną, nieznaną przestrzeń latentną modelu świata. Te macierze unoszące się mogą być wymieniane jako NFT. Im bardziej szalone rzeczy próbujesz, tym bardziej prawdopodobne, że wydobędziesz rzadkie wektory.
Kto pierwszy wyśle Vibe Minecraft, przejdzie do historii jako ten, który na zawsze zmienił bieg gier.

536
Chciałbym zobaczyć Prawo Skalowania FSD, ponieważ jest to jedyny fizyczny mechanizm danych na skalę planetarną. Jaki jest "próg zdolności emergentnej" dla rozmiaru modelu/danych?

Elon Musk6 sie 2025
Tesla trenuje nowy model FSD z ~10-krotną liczbą parametrów i dużą poprawą w zakresie strat kompresji wideo.
Prawdopodobnie gotowy do publicznego wydania pod koniec przyszłego miesiąca, jeśli testy pójdą dobrze.
409
Najlepsze
Ranking
Ulubione