Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Ředitel robotiky společnosti NVIDIA a významný vědec. Spoluvedoucí laboratoře GEAR. Řešení fyzikálního AGI, jeden motor po druhém. Stanford, Ph.D., 1. stážista OpenAI.
Všichni šílí kvůli programování vibrace. V duchu svátků mi dovolte sdílet svou úzkost z divokého západu robotiky. 3 lekce, které jsem se naučil v roce 2025.
1. Hardware je před softwarem, ale spolehlivost hardwaru výrazně omezuje rychlost iterací softwaru.
Viděli jsme vynikající inženýrská umění jako Optimus, e-Atlas, Figure, Neo, G1 a další. Naše nejlepší AI nevyždímala z těchto špičkových hardwarů všechnu sílu. Tělo je schopnější, než co mozek dokáže ovládat. Hlídání těchto robotů však vyžaduje celý operační tým. Na rozdíl od lidí se roboti z modřin nehojí. Přehřívání, rozbité motory, podivné problémy s firmwarem nás pronásledují každý den. Chyby jsou nevratné a neodpouštějící.
Moje trpělivost byla jediná věc, která se měřila.
2. Benchmarking je stále epická katastrofa v robotice.
Normální LLM lidé si mysleli, že MMLU a SWE-Bench jsou zdravý rozum. Držte se na 🍺 robotiku. Nikdo se na ničem neshodne: na hardwarové platformě, definici úkolů, hodnotících hodnoticích, simulátoru nebo reálných nastaveních. Každý je podle definice SOTA podle standardu, který si určuje za pochodu pro každé zpravodajství. Každý si vybere nejhezčí demo ze 100 pokusů.
Musíme se v roce 2026 jako obor zlepšit a přestat považovat reprodukovatelnost a vědeckou disciplínu za občany druhé kategorie.
3. VLA založené na VLM působí špatně.
VLA znamená model "vize-jazyk-akce" a byl dominantním přístupem pro robotické mozky. Recept je jednoduchý: vezměte předtrénovaný VLM checkpoint a namontujte na něj akční modul. Ale když se nad tím zamyslíte, VLM jsou hyperoptimalizované pro benchmarky při výstupech do kopce, jako je vizuální odpovídání na otázky. To implikuje dva problémy: (1) většina parametrů ve VLM je určena pro jazyk a znalosti, nikoli pro fyziku; (2) vizuální enkodéry jsou aktivně naladěny tak, aby *vyloučily* nízkoúrovňové detaily, protože otázky a odpovědi vyžadují pouze pokročilé porozumění. Ale drobné detaily jsou pro jeho obratnost velmi důležité.
Není důvod, aby výkon VLA škáloval podle toho, jak se škálují parametry VLM. Předškolení je nesourodé. Model video světa se zdá být mnohem lepším cílem předškolení pro robotickou politiku. Sázím na to hodně.

326
2024: AI je kopilot
2025+: lidé jsou kopilotem
Copilot je nová inženýrská dovednost. Není snadné opustit místo řidiče – musíme se naučit myslet AI a přizpůsobit se mimozemským pracovním postupům. Pomozte AI, aby nám pomohla.

Andrej Karpathy27. 12. 2025
Nikdy jsem se jako programátor necítil tak pozadu. Profese je dramaticky refaktorovaná, protože bity přispívané programátorem jsou čím dál vzácnější. Mám pocit, že bych mohl být desetkrát silnější, kdybych jen správně spojil to, co se za poslední ~rok objevilo, a neúspěch v získání boostu mi připadá jako otázka dovedností. Je tu nová programovatelná vrstva abstrakce (kromě obvyklých vrstev níže), která zahrnuje agenty, subagenty, jejich prompty, kontexty, paměť, módy, oprávnění, nástroje, pluginy, dovednosti, hooky, MCP, LSP, slash příkazy, workflowy, integrace do IDE a potřebu vytvořit všestranný mentální model pro silné a slabé stránky zásadně stochastických, chybných, nesrozumitelných a měnících se entit, které se náhle promísí s tím, co bývalo starým dobrým inženýrstvím. Je jasné, že se rozdává nějaký mocný mimozemský nástroj, jenže neobsahuje žádný manuál a všichni se musí naučit ho držet a ovládat, zatímco zemětřesení o síle 9 otřásá profesí. Vyhrňte si rukávy, abyste nezaostávali.
153
Top
Hodnocení
Oblíbené

