Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Dyrektor ds. robotyki NVIDIA i wybitny naukowiec. Współprowadzący laboratorium GEAR. Rozwiązywanie fizycznego AGI, jeden silnik na raz. Doktorat Stanforda, pierwszy stażysta OpenAI.
Słuchaj moich słów: każdy rok od teraz będzie Rokiem Robotyki. Jeśli opus 4.5/nanobanana zszokowało cię - cóż, jeszcze nic nie widziałeś w Świecie Atomów. Ciesz się pociągiem LLM, póki trwa. Wsiadam na następny statek rakietowy 🚀
Szczęśliwego nowego roku wszystkim 🎊
(przepraszam, nie mogłem się oprzeć najstarszej figury w AI)

166
Wszyscy panikują z powodu kodowania wibracji. W świątecznym nastroju pozwólcie, że podzielę się moim niepokojem na temat dzikiego zachodu robotyki. 3 lekcje, które nauczyłem się w 2025 roku.
1. Sprzęt wyprzedza oprogramowanie, ale niezawodność sprzętu poważnie ogranicza szybkość iteracji oprogramowania.
Widzieliśmy wspaniałe osiągnięcia inżynieryjne, takie jak Optimus, e-Atlas, Figure, Neo, G1 itd. Nasza najlepsza AI nie wycisnęła jeszcze całego soku z tego nowatorskiego sprzętu. Ciało jest bardziej zdolne niż to, co mózg może nakazać. Jednak opieka nad tymi robotami wymaga całego zespołu operacyjnego. W przeciwieństwie do ludzi, roboty nie leczą się z siniaków. Przegrzewanie, uszkodzone silniki, dziwne problemy z oprogramowaniem dręczą nas na co dzień. Błędy są nieodwracalne i bezlitosne.
Moja cierpliwość była jedyną rzeczą, która się zwiększała.
2. Benchmarking w robotyce to wciąż epicka katastrofa.
Normiki LLM myślały, że MMLU i SWE-Bench to zdrowy rozsądek. Wstrzymajcie swoje 🍺 na robotykę. Nikt się w niczym nie zgadza: platforma sprzętowa, definicja zadania, kryteria oceny, symulator czy rzeczywiste ustawienia. Wszyscy są SOTA, z definicji, w benchmarku, który definiują na bieżąco przy każdej zapowiedzi. Wszyscy wybierają najładniejszą demonstrację spośród 100 prób.
Musimy się poprawić jako dziedzina w 2026 roku i przestać traktować reprodukowalność i dyscyplinę naukową jako obywateli drugiej kategorii.
3. VLM oparte na VLA wydaje się błędne.
VLA oznacza model "wizja-język-działanie" i jest dominującym podejściem dla mózgów robotów. Przepis jest prosty: weź punkt kontrolny VLM po wstępnym szkoleniu i graftuj moduł działania na górze. Ale jeśli się nad tym zastanowisz, VLM są hiperoptymalizowane do wspinania się po benchmarkach, takich jak odpowiadanie na pytania wizualne. To implikuje dwa problemy: (1) większość parametrów w VLM dotyczy języka i wiedzy, a nie fizyki; (2) enkodery wizualne są aktywnie dostosowywane do *odrzucania* szczegółów niskiego poziomu, ponieważ Q&A wymaga tylko zrozumienia na wysokim poziomie. Ale drobne szczegóły mają ogromne znaczenie dla zręczności.
Nie ma powodu, dla którego wydajność VLA miałaby rosnąć w miarę wzrostu parametrów VLM. Wstępne szkolenie jest źle dopasowane. Model świata wideo wydaje się być znacznie lepszym celem wstępnego szkolenia dla polityki robotów. Stawiam na to duże pieniądze.

377
2024: AI jest współpilotem
2025+: ludzie są współpilotem
Współpilot to nowa umiejętność inżynieryjna. Nie jest łatwo opuścić fotel kierowcy - musimy nauczyć się myśleć w sposób AI i dostosować się do obcych przepływów pracy. Pomóż AI pomóc sobie.

Andrej Karpathy27 gru 2025
Nigdy nie czułem się tak bardzo w tyle jako programista. Zawód jest dramatycznie przekształcany, ponieważ wkład programisty staje się coraz bardziej rzadki i rozproszony. Mam wrażenie, że mógłbym być 10 razy bardziej wydajny, gdybym tylko odpowiednio połączył to, co stało się dostępne w ciągu ostatniego ~roku, a brak umiejętności, by to wykorzystać, wydaje się zdecydowanie problemem ze zdolnościami. Pojawiła się nowa programowalna warstwa abstrakcji do opanowania (oprócz zwykłych warstw poniżej), obejmująca agentów, podagentów, ich polecenia, konteksty, pamięć, tryby, uprawnienia, narzędzia, wtyczki, umiejętności, haki, MCP, LSP, polecenia slash, przepływy pracy, integracje IDE oraz potrzebę zbudowania wszechstronnego modelu mentalnego dla mocnych i słabych stron zasadniczo stochastycznych, omylnych, nieczytelnych i zmieniających się bytów, które nagle mieszają się z tym, co kiedyś było tradycyjnym inżynierią. Wyraźnie przekazano jakieś potężne obce narzędzie, ale nie ma do niego instrukcji, a wszyscy muszą dowiedzieć się, jak je trzymać i obsługiwać, podczas gdy wynikająca z tego trzęsienie ziemi o magnitudzie 9 wstrząsa zawodem. Zakasać rękawy, aby nie zostać w tyle.
172
Najlepsze
Ranking
Ulubione
