المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
مدير الروبوتات والعالم المتميز في NVIDIA. قائد مشارك لمختبر GEAR. حل AGI المادي ، محرك واحد في كل مرة. دكتوراه في جامعة ستانفورد المتدرب الأول في OpenAI.
أنا ألاحظ مفارقة مورافيك الصغيرة في الروبوتات: الجمباز الذي يصعب على البشر أسهل بكثير بالنسبة للروبوتات من المهام "غير المثيرة" مثل الطهي والتنظيف والتجميع. إنه يؤدي إلى تنافر معرفي للأشخاص خارج المجال ، "لذا ، يمكن للروبوتات الباركور والبريك دانس ، ولكن لماذا لا يمكنهم الاعتناء بكلبي؟" صدقني ، لقد سألني والداي عن هذا أكثر مما تعتقد ...
تخلق "مفارقة Robot Moravec" أيضا الوهم بأن قدرات الذكاء الاصطناعي المادية أكثر تقدما مما هي عليه بالفعل. أنا لا أفرد Unitree ، لأنه ينطبق على نطاق واسع على جميع العروض البهلوانية الحديثة في الصناعة. إليك اختبار بسيط: إذا قمت بإعداد جدار أمام الروبوت الجانبي ، فسوف يصطدم به بكامل قوته ويصنع مشهدا. لأنها مجرد فرط في تلك الحركة المرجعية الفردية ، دون أي وعي بالبيئة المحيطة.
إليكم سبب وجود المفارقة: من الأسهل بكثير تدريب "لاعب جمباز أعمى" من الروبوت الذي يرى ويتلاعب. يمكن حل الأول بالكامل في المحاكاة ونقله بدون لقطة إلى العالم الحقيقي ، بينما يتطلب الأخير عرضا واقعيا للغاية وفيزياء الاتصال وديناميكيات كائنات فوضوية في العالم الحقيقي - لا يمكن محاكاة أي منها بشكل جيد.
تخيل أنه يمكنك تدريب LLMs ليس من الإنترنت ، ولكن من لعبة وحدة تحكم نصية مصنوعة يدويا بحتة. كان علماء الروبوتات محظوظين. نحن نعيش في عالم تكون فيه محركات الفيزياء المتسارعة جيدة جدا بحيث يمكننا الإفلات من الألعاب البهلوانية الرائعة باستخدام بيانات حقيقية صفرية حرفيا. لكننا لم نكتشف بعد نفس رمز الغش للبراعة العامة.
حتى ذلك الحين ، سنظل نستجوبنا من قبل والدينا المرتبكين.
318.95K
شريط AGI الخاص بي أبسط بكثير: الذكاء الاصطناعي يطبخ عشاءا لطيفا في منزل أي شخص لأي مطبخ. من المحتمل جدا أن يكون اختبار تورينج البدني أصعب من جائزة نوبل. ستستمر مفارقة مورافيك في مطاردتنا ، وتلوح في الأفق بشكل أكبر وأكثر قتامة ، خلال العقد القادم.

Thomas Wolf19 يوليو، 16:06
شريطي ل AGI هو الذكاء الاصطناعي الذي فاز بجائزة نوبل لنظرية جديدة نشأها.
99.02K
لقد كنت هادئا بعض الشيء على X مؤخرا. لقد كان العام الماضي تجربة تحويلية. Grok-4 و Kimi K2 رائعان ، لكن عالم الروبوتات هو غرب متوحش رائع. يبدو الأمر وكأنه البرمجة اللغوية العصبية في عام 2018 عندما تم نشر GPT-1 ، جنبا إلى جنب مع BERT وآلاف زهرة أخرى أزهرت. لم يكن أحد يعرف أيهما سيصبح ChatGPT في النهاية. كانت المناقشات ساخنة. كانت الانتروبيا عالية السماء. كانت الأفكار ممتعة بجنون.
أعتقد أن GPT-1 للروبوتات موجود بالفعل في مكان ما على Arxiv ، لكننا لا نعرف بالضبط أيهما. يمكن أن تكون نماذج عالمية ، RL ، التعلم من الفيديو البشري ، sim2real ، real2sim ، إلخ ، إلخ ، أو أي مجموعة منها. المناقشات ساخنة. الانتروبيا عالية السماء. الأفكار ممتعة بجنون ، بدلا من الضغط على النسبة القليلة الأخيرة على AIME و GPQA.
كما أن طبيعة الروبوتات تعقد مساحة التصميم بشكل كبير. على عكس العالم النظيف للبتات ل LLMs (سلاسل نصية) ، يتعين علينا نحن علماء الروبوتات التعامل مع عالم الذرات الفوضوي. بعد كل شيء ، هناك كتلة من المعدن المحدد بالبرمجيات في الحلقة. قد تجد معايير LLM صعوبة في تصديق ، لكن علماء الروبوتات لا يزالون حتى الآن غير قادرين على الاتفاق على معيار! تحتوي الروبوتات المختلفة على مظاريف قدرات مختلفة - بعضها أفضل في الألعاب البهلوانية والبعض الآخر في معالجة الأشياء. بعضها مخصص للاستخدام الصناعي بينما البعض الآخر مخصص للمهام المنزلية. التجسيد المتقاطع ليس مجرد حداثة بحثية ، ولكنه ميزة أساسية لدماغ روبوت عالمي.
لقد تحدثت إلى العشرات من العملاء المحتملين في C-suite من العديد من شركات الروبوتات القديمة والجديدة. يبيع البعض الجسم كله. يبيع البعض أجزاء من الجسم مثل الأيدي البارعة. يبيع العديد من الآخرين المجارف لتصنيع أجسام جديدة أو إنشاء عمليات محاكاة أو جمع مجموعات ضخمة من البيانات. مساحة أفكار العمل جامحة مثل البحث نفسه. إنه اندفاع ذهبي جديد ، لم نشهده منذ موجة ChatGPT لعام 2022.
أفضل وقت للدخول هو عندما يصل عدم الإجماع إلى ذروته. ما زلنا في بداية منحنى الخسارة - هناك علامات قوية على الحياة ، ولكن بعيدة كل البعد عن التقارب. كل خطوة متدرجة تأخذنا إلى المجهول. لكن هناك شيء واحد أعرفه على وجه اليقين - لا يوجد AGI دون اللمس والشعور والتجسد في العالم الفوضوي.
في ملاحظة شخصية أكثر - يأتي تشغيل مختبر أبحاث بمستوى جديد تماما من المسؤولية. إن تقديم التحديثات مباشرة إلى الرئيس التنفيذي لشركة 4 تريليونات دولار هو ، بعبارة ملطفة ، مثير ومستهلك بالكامل لأوزان انتباهي. لقد ولت الأيام التي كان بإمكاني فيها البقاء على اطلاع والتعمق في كل أخبار الذكاء الاصطناعي.
سأحاول تخصيص وقت لمشاركة المزيد من رحلتي.

876.93K
اختبار تورينج البدني: منزلك في حالة من الفوضى الكاملة بعد هاكاثون يوم الأحد. ليلة الاثنين ، تعود إلى المنزل إلى غرفة معيشة نقية وعشاء على ضوء الشموع. ولا يمكنك معرفة ما إذا كان هناك إنسان أو آلة. بسيط مخادع ، صعب بجنون.
إنه نجم الشمال التالي لمنظمة الذكاء الاصطناعي. الحلم الذي يبقيني مستيقظا 12 صباحا في المختبر. رؤية منصة الحوسبة التالية التي تعمل على أتمتة أجزاء من الذرات بدلا من قطع البت.
شكرا سيكويا لاستضافتي في الذكاء الاصطناعي Asscent! فيما يلي حديثي الكامل عن المبادئ الأولى لحل الروبوتات للأغراض العامة: كيف نفكر في استراتيجية البيانات وقوانين التوسع. أؤكد لك أنها ستكون 17 دقيقة لا تندم!
107.2K
في يوم من الأيام في العقد المقبل ، سيكون لدينا روبوتات في كل منزل وكل مستشفى ومصنع ، تقوم بكل وظائف مملة وخطيرة ببراعة خارقة. سيعرف ذلك اليوم باسم "الخميس". حتى تورينج لن يجرؤ على الحلم بحياتنا في أعنف أحلامه.

signüll21 أبريل 2025
we crossed the turing test & no one gave a shit. no parades. no front page headlines. just… a casual shrug. like “oh yeah, the machines are smart enough to fool us now. anyway, what’s for lunch?”
that silence tells you everything about the pace we’re moving at.
back in my cs classes, the turing test was treated like the final boss. now every break through is another god damn tuesday.
101.94K
ستكون الألعاب الأولمبية البشرية في عام 2030 مشهدا رائعا

Jim Fan5 فبراير 2025
لقد قمنا بتحويل الروبوتات البشرية إلى كريستيانو رونالدو وليبرون جيمس وكوبي بيرانت! هذه شبكات عصبية تعمل على أجهزة حقيقية في مختبر GEAR الخاص بنا. معظم العروض التوضيحية للروبوت التي تراها عبر الإنترنت تسرع مقاطع الفيديو. نحن في الواقع * نبطئها * حتى تتمكن من الاستمتاع بحركات السوائل.
أنا متحمس للإعلان عن "ASAP" ، وهو نموذج "real2sim2real" يتقن الحركات السلسة والديناميكية للغاية للتحكم البشري في الجسم بالكامل.
نقوم بتدريب الروبوت مسبقا في المحاكاة أولا ، ولكن هناك فجوة سيئة السمعة في "sim2real": من الصعب جدا على معادلات الفيزياء المصممة يدويا أن تتطابق مع ديناميكيات العالم الحقيقي.
إصلاحنا بسيط: ما عليك سوى نشر سياسة مدربة مسبقا على الأجهزة الحقيقية ، وجمع البيانات ، وإعادة تشغيل الحركة في sim. من الواضح أن الإعادة ستحتوي على العديد من الأخطاء ، لكن هذا يعطي إشارة غنية للتعويض عن التناقض الفيزيائي. استخدم شبكة عصبية أخرى لتعلم الدلتا. في الأساس ، نقوم "بتصحيح" محرك فيزياء تقليدي ، بحيث يمكن للروبوت تجربة العالم الحقيقي تقريبا على نطاق واسع في وحدات معالجة الرسومات.
المستقبل هو محاكاة هجينة: الجمع بين قوة محركات sim الكلاسيكية التي تم صقلها على مدى عقود والقدرة الخارقة ل NNs الحديثة على التقاط عالم فوضوي.
45.82K
لقد قمنا بتحويل الروبوتات البشرية إلى كريستيانو رونالدو وليبرون جيمس وكوبي بيرانت! هذه شبكات عصبية تعمل على أجهزة حقيقية في مختبر GEAR الخاص بنا. معظم العروض التوضيحية للروبوت التي تراها عبر الإنترنت تسرع مقاطع الفيديو. نحن في الواقع * نبطئها * حتى تتمكن من الاستمتاع بحركات السوائل.
أنا متحمس للإعلان عن "ASAP" ، وهو نموذج "real2sim2real" يتقن الحركات السلسة والديناميكية للغاية للتحكم البشري في الجسم بالكامل.
نقوم بتدريب الروبوت مسبقا في المحاكاة أولا ، ولكن هناك فجوة سيئة السمعة في "sim2real": من الصعب جدا على معادلات الفيزياء المصممة يدويا أن تتطابق مع ديناميكيات العالم الحقيقي.
إصلاحنا بسيط: ما عليك سوى نشر سياسة مدربة مسبقا على الأجهزة الحقيقية ، وجمع البيانات ، وإعادة تشغيل الحركة في sim. من الواضح أن الإعادة ستحتوي على العديد من الأخطاء ، لكن هذا يعطي إشارة غنية للتعويض عن التناقض الفيزيائي. استخدم شبكة عصبية أخرى لتعلم الدلتا. في الأساس ، نقوم "بتصحيح" محرك فيزياء تقليدي ، بحيث يمكن للروبوت تجربة العالم الحقيقي تقريبا على نطاق واسع في وحدات معالجة الرسومات.
المستقبل هو محاكاة هجينة: الجمع بين قوة محركات sim الكلاسيكية التي تم صقلها على مدى عقود والقدرة الخارقة ل NNs الحديثة على التقاط عالم فوضوي.
543.12K
أن الورقة * الثانية * التي أسقطت مع الكثير من أسرار دولاب الموازنة RL و * متعدد الوسائط * على غرار o1 ليست موجودة على بطاقة البنغو الخاصة بي اليوم. تقاربت أوراق Kimi (شركة ناشئة أخرى) و DeepSeek بشكل ملحوظ حول نتائج مماثلة:
> لا حاجة للبحث الشجري المعقد مثل MCTS. ما عليك سوى خطية تتبع الفكر والقيام بالتنبؤ الانحدار الذاتي القديم الجيد.
> لا حاجة لوظائف القيمة التي تتطلب نسخة أخرى باهظة الثمن من النموذج ؛
> لا حاجة لنمذجة المكافآت الكثيفة. اعتمد قدر الإمكان على الحقيقة الأرضية والنتيجة النهائية.
فوارق:
> يقوم DeepSeek بنهج AlphaZero - التمهيد البحت من خلال RL بدون المدخلات البشرية ، أي "البداية الباردة". يقوم Kimi بنهج AlphaGo-Master: SFT خفيف للإحماء من خلال آثار CoT المصممة على الفور.
> أوزان DeepSeek هي ترخيص معهد ماساتشوستس للتكنولوجيا (قيادة الفكر!) ؛ Kimi ليس لديه إصدار نموذج حتى الآن.
يظهر > Kimi أداء قويا متعدد الوسائط (!) على معايير مثل MathVista ، والذي يتطلب فهما بصريا للهندسة واختبارات الذكاء وما إلى ذلك.
تحتوي ورقة Kimi > على الكثير من التفاصيل حول تصميم النظام: البنية التحتية RL ، والمجموعة الهجينة ، ووضع الحماية للكود ، واستراتيجيات التوازي. وتفاصيل التعلم: السياق الطويل ، وضغط CoT ، والمناهج الدراسية ، واستراتيجية أخذ العينات ، وإنشاء حالة الاختبار ، وما إلى ذلك.
يقرأ متفائل في عطلة!

300.43K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز