熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Jim Fan
NVIDIA 機器人總監和傑出科學家。GEAR 實驗室聯合負責人。解決物理 AGI,一次一個電機。斯坦福大學博士 OpenAI 的第 1 名實習生。
我觀察到機器人領域中的一個迷你莫拉維克悖論:對人類來說困難的體操,對機器人來說卻容易得多,而像烹飪、清潔和組裝這樣的「不性感」任務卻相對困難。這讓外行人產生了認知失調,「所以,機器人可以做跑酷和霹靂舞,但為什麼牠們不能照顧我的狗呢?」相信我,我的父母問過我這個問題的次數比你想的還要多……
「機器人莫拉維克悖論」也造成了物理AI能力遠比實際更先進的錯覺。我並不是單獨針對Unitree,這適用於行業中所有最近的特技演示。這裡有一個簡單的測試:如果你在側翻機器人面前設置一面牆,它會全力撞上去,造成一場表演。因為它只是過度擬合那個單一的參考動作,對周圍環境毫無意識。
悖論存在的原因是:訓練一個「盲目體操運動員」比訓練一個能看見和操控的機器人要容易得多。前者可以完全在模擬中解決,並且可以零樣本轉移到現實世界,而後者則需要極其真實的渲染、接觸物理和混亂的現實物體動態——這些都無法很好地模擬。
想像一下,你可以不從互聯網訓練LLM,而是從一個純手工製作的文字控制遊戲中訓練。機器人學家們運氣不錯。我們恰好生活在一個加速物理引擎如此出色的世界中,以至於我們可以在幾乎沒有真實數據的情況下實現令人印象深刻的特技。但我們尚未發現通用靈巧性的同樣作弊代碼。
在那之前,我們仍然會被困惑的父母質疑。
318.94K
我對AGI的標準簡單得多:一個AI能在任何人的家裡為任何菜系做一頓美味的晚餐。實體圖靈測試很可能比諾貝爾獎更難。莫拉維克悖論將繼續困擾我們,在未來十年中愈加陰影籠罩。

Thomas Wolf7月19日 16:06
我對AGI的標準是,一個AI能夠因其創造的新理論而獲得諾貝爾獎。
99.01K
我最近在 X 上有點安靜。過去一年是一個變革性的經歷。Grok-4 和 Kimi K2 都很棒,但機器人技術的世界就像一個奇妙的西部荒野。這感覺就像 2018 年的 NLP,當時 GPT-1 發布,還有 BERT 和其他一千朵盛開的花朵。沒有人知道哪一個最終會成為 ChatGPT。辯論非常激烈。熵高得驚人。想法非常有趣。
我相信機器人的 GPT-1 已經在 Arxiv 上的某個地方,但我們不知道具體是哪一個。可能是世界模型、強化學習、從人類視頻中學習、sim2real、real2sim 等等,或者它們的任何組合。辯論依然激烈。熵高得驚人。想法非常有趣,而不是在 AIME 和 GPQA 上擠出最後幾個百分比。
機器人的本質也大大複雜了設計空間。與 LLM(文本字符串)的乾淨位元世界不同,我們這些機器人學家必須面對混亂的原子世界。畢竟,循環中有一塊軟件定義的金屬。LLM 的普通人可能很難相信,但到目前為止,機器人學家仍然無法就基準達成一致!不同的機器人有不同的能力範圍——有些在雜技方面更好,而其他則在物體操作方面更強。有些是為工業用途而設計的,而其他則是為家庭任務而設計的。跨體現不僅僅是一個研究新奇,而是通用機器人大腦的基本特徵。
我與來自各種機器人公司的數十位 C-suite 領導者交談過,無論是老公司還是新公司。有些賣整個身體。有些賣如靈巧手這樣的身體部件。還有許多其他公司出售製造新身體的工具、創建模擬或收集大量數據的工具。商業理念空間與研究本身一樣狂野。這是一場新的淘金熱,自 2022 年 ChatGPT 浪潮以來我們還沒有見過這樣的情況。
進入的最佳時機是當非共識達到峰值時。我們仍然處於損失曲線的開始——有強烈的生命跡象,但距離收斂還有很遠、很遠的距離。每一步梯度都將我們帶入未知。但我確實知道一件事——沒有觸摸、感受和在混亂世界中具體化,就沒有 AGI。
在更個人化的層面上——經營一個研究實驗室帶來了全新的責任感。直接向一家 4 萬億美元公司的 CEO 提供更新,簡而言之,既令人興奮又消耗我所有的注意力。過去我可以隨時掌握並深入了解每一條 AI 新聞的日子已經一去不復返了。
我會努力抽出時間分享更多我的旅程。

876.92K
在未來十年的某一天,我們的每個家庭、每家醫院和每家工廠都會有機器人,以超人的靈巧能力完成每一項枯燥而危險的工作。那一天將被稱為 「星期四」。即使是圖靈也不敢在他最瘋狂的夢想中夢想我們的一生。

signüll2025年4月21日
我們通過了圖靈測試,沒人在乎。沒有遊行。沒有頭版頭條。只。。。漫不經心地聳聳肩。就像“哦,是的,機器現在足夠聰明瞭,可以騙過我們。話說回來,午餐吃什麼?
這種寂靜告訴你關於我們前進的速度的一切。
回到我的 CS 課上,圖靈測試被視為最終 Boss。現在每一次突破都是另一個該死的星期二。
101.93K
2030 年的人形奧運會將是一場盛大的比賽

Jim Fan2025年2月5日
我們將人形機器人 RL 給 Cristiano Ronaldo、LeBron James 和 Kobe Byrant!這些是在我們 GEAR 實驗室的真實硬體上運行的神經網路。您在網上看到的大多數機器人演示都加快了視頻的速度。我們實際上會減慢它們的速度,以便您可以享受流暢的動作。
我很高興地宣佈推出“ASAP”,這是一款“real2sim2real”模型,它掌握了人形全身控制的極其流暢和動態的動作。
我們首先在模擬中對機器人進行預訓練,但存在一個臭名昭著的“sim2real”差距:手動設計的物理方程式很難與現實世界的動力學相匹配。
我們的解決方法很簡單:只需在真實硬體上部署預訓練策略,收集數據,並在 sim 中重放運動。重放顯然會有很多錯誤,但這會提供豐富的信號來補償物理差異。使用另一個神經網路來學習 delta。基本上,我們「修補」了傳統的物理引擎,以便機器人可以在 GPU 中大規模體驗幾乎真實的世界。
未來是混合類比:將幾十年來改進的經典類比引擎的強大功能與現代 NN 的不可思議的能力相結合,以捕捉混亂的世界。
45.81K
我們將人形機器人 RL 給 Cristiano Ronaldo、LeBron James 和 Kobe Byrant!這些是在我們 GEAR 實驗室的真實硬體上運行的神經網路。您在網上看到的大多數機器人演示都加快了視頻的速度。我們實際上會減慢它們的速度,以便您可以享受流暢的動作。
我很高興地宣佈推出“ASAP”,這是一款“real2sim2real”模型,它掌握了人形全身控制的極其流暢和動態的動作。
我們首先在模擬中對機器人進行預訓練,但存在一個臭名昭著的“sim2real”差距:手動設計的物理方程式很難與現實世界的動力學相匹配。
我們的解決方法很簡單:只需在真實硬體上部署預訓練策略,收集數據,並在 sim 中重放運動。重放顯然會有很多錯誤,但這會提供豐富的信號來補償物理差異。使用另一個神經網路來學習 delta。基本上,我們「修補」了傳統的物理引擎,以便機器人可以在 GPU 中大規模體驗幾乎真實的世界。
未來是混合類比:將幾十年來改進的經典類比引擎的強大功能與現代 NN 的不可思議的能力相結合,以捕捉混亂的世界。
543.11K
那篇帶有大量 RL 飛輪秘密和*多模態* o1 風格推理的*第二篇*論文今天不在我的賓果卡上。Kimi(另一家初創公司)和 DeepSeek 的論文在相似的發現上驚人地趨同:
> 無需像MCTS那樣進行複雜的樹搜索。只需線性化思維軌跡並做好的舊自回歸預測;
> 不需要需要另一個昂貴的模型副本的值函數;
> 無需密集的獎勵建模。盡可能多地依賴 groundtruth,最終結果。
差異:
> DeepSeek 採用 AlphaZero 方法 - 純粹通過 RL 引導,無需人工輸入,即“冷啟動”。Kimi 採用 AlphaGo-Master 方法:通過提示設計的 CoT 跟蹤來輕 SFT 預熱。
> DeepSeek 權重是 MIT 許可證(思想領導力!Kimi 還沒有模型發佈。
> Kimi 在 MathVista 等基準測試中表現出強大的多模態性能 (!),這需要對幾何圖形、IQ 測試等進行可視化理解。
> Kimi 論文中提供了有關系統設計的更多細節:RL 基礎設施、混合集群、代碼沙箱、並行策略;和學習細節:長上下文、CoT 壓縮、課程、抽樣策略、測試用例生成等。
假期的樂觀讀物!

300.42K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可