Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
NVIDIA:s chef för robotik och framstående forskare. Co-Lead för GEAR-labbet. Lösa fysikalisk AGI, en motor i taget. Stanford Ph.D. OpenAI:s 1:a praktikant.
Jag observerar en mini-Moravecs paradox inom robotik: gymnastik som är svår för människor är mycket lättare för robotar än "osexiga" uppgifter som matlagning, städning och montering. Det leder till en kognitiv dissonans för människor utanför fältet, "så, robotar kan parkour och breakdance, men varför kan de inte ta hand om min hund?" Tro mig, jag fick frågan av mina föräldrar om detta mer än du tror ...
"Robot Moravecs paradox" skapar också en illusion av att fysiska AI-funktioner är mycket mer avancerade än de egentligen är. Jag pekar inte ut Unitree, eftersom det gäller i stor utsträckning för alla de senaste akrobatiska demos i branschen. Här är ett enkelt test: om du sätter upp en vägg framför den sidovändande roboten kommer den att smälla in i den med full kraft och göra ett spektakel. För det är bara att överanpassa den där enda referensrörelsen, utan någon medvetenhet om omgivningen.
Här är varför paradoxen finns: det är mycket lättare att träna en "blind gymnast" än en robot som ser och manipulerar. Det förstnämnda kan lösas helt i simulering och överföras nollskott till den verkliga världen, medan det senare kräver extremt realistisk rendering, kontaktfysik och rörig objektdynamik i den verkliga världen - varav ingen kan simuleras bra.
Föreställ dig att du kan träna LLM:er inte från internet, utan från ett rent handgjort textkonsolspel. Robotikerna hade tur. Vi råkar leva i en värld där accelererade fysikmotorer är så bra att vi kan komma undan med imponerande akrobatik med bokstavligen noll verkliga data. Men vi har ännu inte upptäckt samma fuskkod för allmän fingerfärdighet.
Tills dess kommer vi fortfarande att bli ifrågasatta av våra förvirrade föräldrar.
318,94K
Min bar för AGI är mycket enklare: en AI som lagar en trevlig middag hemma hos någon för vilket kök som helst. Det fysiska Turingtestet är med stor sannolikhet svårare än Nobelpriset. Moravecs paradox kommer att fortsätta att förfölja oss, torna upp sig större och mörkare under det kommande decenniet.

Thomas Wolf19 juli 16:06
Min ribba för AGI är att en AI vinner ett Nobelpris för en ny teori som den har skapat.
99,01K
Jag har varit lite tyst om X den senaste tiden. Det senaste året har varit en omvälvande upplevelse. Grok-4 och Kimi K2 är fantastiska, men robotikens värld är en underbar vilda västern. Det känns som NLP 2018 när GPT-1 publicerades, tillsammans med BERT och tusen andra blommor som blommade. Ingen visste vilken som så småningom skulle bli ChatGPT. Debatterna gick heta. Entropin var skyhög. Idéerna var vansinnigt roliga.
Jag tror att robotikens GPT-1 redan finns någonstans på Arxiv, men vi vet inte exakt vilken. Kan vara världsmodeller, RL, lära sig av mänsklig video, sim2real, real2sim, etc. etc, eller någon kombination av dem. Debatterna går heta. Entropin är skyhög. Idéer är vansinnigt roliga, istället för att pressa de sista procenten på AIME & GPQA.
Robotikens natur komplicerar också i hög grad designutrymmet. Till skillnad från den rena världen av bitar för LLM:er (textsträngar) måste vi robotiker hantera den röriga världen av atomer. Det finns trots allt en klump mjukvarudefinierad metall i loopen. LLM-normies kan ha svårt att tro, men än så länge kan robotiker fortfarande inte komma överens om ett riktmärke! Olika robotar har olika förmågor - vissa är bättre på akrobatik medan andra är på att manipulera föremål. Vissa är avsedda för industriellt bruk medan andra är för hushållsuppgifter. Cross-embodiment är inte bara en forskningsnyhet, utan en viktig funktion för en universell robothjärna.
Jag har pratat med dussintals C-suite-leads från olika robotföretag, gamla som nya. En del säljer hela kroppen. Vissa säljer kroppsdelar som fingerfärdiga händer. Många fler andra säljer spadarna för att tillverka nya kroppar, skapa simuleringar eller samla in enorma mängder data. Affärsidéområdet är lika vilt som forskningen själv. Det är en ny guldrush, vars like vi inte har sett sedan ChatGPT-vågen 2022.
Den bästa tiden att gå in är när icke-konsensus är som högst. Vi är fortfarande i början av en förlustkurva - det finns starka tecken på liv, men långt, långt borta från konvergens. Varje steg i gradienten tar oss in i det okända. Men en sak vet jag säkert - det finns ingen AGI utan att beröra, känna och förkroppsligas i den röriga världen.
På ett mer personligt plan - att driva ett forskningslaboratorium kommer med en helt ny nivå av ansvar. Att ge uppdateringar direkt till VD:n för ett företag som kostar 4 biljoner dollar är, för att uttrycka det milt, både spännande och allt uppslukande av min uppmärksamhet. Borta är de dagar då jag kunde hålla koll på och dyka djupt in i varje AI-nyheter.
Jag ska försöka ta mig tid att dela med mig mer av min resa.

876,93K
Det fysiska Turingtestet: ditt hus är en enda röra efter ett söndagshackathon. På måndagskvällen kommer du hem till ett oklanderligt vardagsrum och en middag med levande ljus. Och man kunde inte avgöra om det var en människa eller en maskin som hade varit där. Bedrägligt enkelt, vansinnigt svårt.
Det är nästa polstjärna inom AI. Drömmen som håller mig vaken klockan 12 på labbet. Visionen för nästa datorplattform som automatiserar bitar av atomer istället för bitar av bitar.
Tack Sequoia för att du tog emot mig på AI Ascent! Nedan följer mitt fullständiga föredrag om de första principerna för att lösa robotteknik för allmänna ändamål: hur vi tänker kring datastrategin och skalningslagarna. Jag försäkrar dig att det kommer att vara 17 minuter du inte ångrar!
107,2K
En dag under nästa decennium kommer vi att ha robotar i varje hem, varje sjukhus och fabrik, som utför alla tråkiga och farliga jobb med övermänsklig fingerfärdighet. Den dagen kommer att kallas "torsdag". Inte ens Turing skulle våga drömma om vårt liv i sina vildaste drömmar.

signüll21 apr. 2025
Vi korsade Turingtestet och ingen brydde sig ett skit. Inga parader. Inga rubriker på förstasidan. bara... En nonchalant axelryckning. Som "Åh ja, maskinerna är smarta nog att lura oss nu. Hur som helst, vad blir det till lunch?"
Den tystnaden säger allt om den takt vi rör oss i.
På mina CS-lektioner behandlades Turingtestet som den sista bossen. Nu är varje genombrott ännu en jävla tisdag.
101,93K
Humanoid Olympics 2030 kommer att bli ett riktigt spektakel

Jim Fan5 feb. 2025
Vi har skickat humanoida robotar till Cristiano Ronaldo, LeBron James och Kobe Byrant! Det här är neurala nät som körs på riktig hårdvara i vårt GEAR-labb. De flesta robotdemos du ser online snabbar upp videorna. Vi saktar faktiskt ner dem så att du kan njuta av de flytande rörelserna.
Jag är glad att kunna presentera "ASAP", en "real2sim2real" -modell som behärskar extremt mjuka och dynamiska rörelser för humanoid helkroppskontroll.
Vi förtränar roboten i simulering först, men det finns en ökänd "sim2real"-lucka: det är mycket svårt för handkonstruerade fysikekvationer att matcha dynamiken i den verkliga världen.
Vår lösning är enkel: distribuera bara en förtränad policy på verklig hårdvara, samla in data och spela upp rörelsen i sim. Reprisen kommer naturligtvis att ha många fel, men det ger en rik signal för att kompensera för fysikavvikelsen. Använd ett annat neuralt nätverk för att lära dig delta. I grund och botten "lappar vi ihop" en traditionell fysikmotor, så att roboten kan uppleva nästan den verkliga världen i stor skala i GPU:er.
Framtiden är hybridsimulering: kombinera kraften hos klassiska simmotorer som förfinats under årtionden med den kusliga förmågan hos moderna NN:er att fånga en rörig värld.
45,81K
Vi har skickat humanoida robotar till Cristiano Ronaldo, LeBron James och Kobe Byrant! Det här är neurala nät som körs på riktig hårdvara i vårt GEAR-labb. De flesta robotdemos du ser online snabbar upp videorna. Vi saktar faktiskt ner dem så att du kan njuta av de flytande rörelserna.
Jag är glad att kunna presentera "ASAP", en "real2sim2real" -modell som behärskar extremt mjuka och dynamiska rörelser för humanoid helkroppskontroll.
Vi förtränar roboten i simulering först, men det finns en ökänd "sim2real"-lucka: det är mycket svårt för handkonstruerade fysikekvationer att matcha dynamiken i den verkliga världen.
Vår lösning är enkel: distribuera bara en förtränad policy på verklig hårdvara, samla in data och spela upp rörelsen i sim. Reprisen kommer naturligtvis att ha många fel, men det ger en rik signal för att kompensera för fysikavvikelsen. Använd ett annat neuralt nätverk för att lära dig delta. I grund och botten "lappar vi ihop" en traditionell fysikmotor, så att roboten kan uppleva nästan den verkliga världen i stor skala i GPU:er.
Framtiden är hybridsimulering: kombinera kraften hos klassiska simmotorer som förfinats under årtionden med den kusliga förmågan hos moderna NN:er att fånga en rörig värld.
543,12K
Att en * andra * papper droppade med massor av RL svänghjul hemligheter och * multimodal * o1-stil resonemang är inte på min bingo bricka idag. Kimis (en annan startup) och DeepSeeks artiklar sammanstrålade anmärkningsvärt nog på liknande resultat:
> Inget behov av komplex trädsökning som MCTS. Linjärisera bara tankespåret och gör gamla goda autoregressiva förutsägelser;
> Inget behov av värdefunktioner som kräver ytterligare en dyr kopia av modellen.
> Inget behov av tät belöningsmodellering. Lita så mycket som möjligt på grundsanningen, slutresultatet.
Skillnader:
> DeepSeek gör AlphaZero tillvägagångssätt - rent bootstrap genom RL utan mänsklig input, dvs "kallstart". Kimi använder sig av AlphaGo-Master-metoden: lätt SFT för att värma upp genom snabbkonstruerade CoT-spår.
> DeepSeek-vikter är MIT-licens (thought leadership!); Kimi har ännu inte fått någon modellrelease.
> Kimi visar stark multimodal prestanda (!) på benchmarks som MathVista, vilket kräver visuell förståelse för geometri, IQ-tester, etc.
> Kimi-papper har MYCKET mer information om systemdesignen: RL-infrastruktur, hybridkluster, kodsandlåda, parallellitetsstrategier; och inlärningsdetaljer: lång kontext, CoT-komprimering, läroplan, provtagningsstrategi, generering av testfall, etc.
Optimistisk läsning på en semester!

300,42K
Topp
Rankning
Favoriter
Trendande på kedjan
Trendande på X
Senaste toppfinansieringarna
Mest anmärkningsvärda