Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Direktur Robotika & Ilmuwan Terkemuka NVIDIA. Co-Lead lab GEAR. Memecahkan AGI Fisik, satu motor pada satu waktu. Stanford Ph.D. Magang pertama OpenAI.
Saya mengamati paradoks Moravec mini dalam robotika: senam yang sulit bagi manusia jauh lebih mudah bagi robot daripada tugas "tidak seksi" seperti memasak, membersihkan, dan merakit. Ini mengarah pada disonansi kognitif bagi orang-orang di luar lapangan, "jadi, robot bisa parkour & breakdance, tetapi mengapa mereka tidak bisa merawat anjing saya?" Percayalah, saya ditanya oleh orang tua saya tentang hal ini lebih dari yang Anda pikirkan ...
"Paradoks Robot Moravec" juga menciptakan ilusi bahwa kemampuan AI fisik jauh lebih maju daripada yang sebenarnya. Saya tidak memilih Unitree, karena berlaku secara luas untuk semua demo akrobatik terbaru di industri ini. Berikut tes sederhananya: jika Anda memasang dinding di depan robot yang membalik samping, ia akan menghantamnya dengan kekuatan penuh dan membuat tontonan. Karena itu hanya terlalu sesuai dengan gerakan referensi tunggal itu, tanpa kesadaran akan lingkungan sekitar.
Inilah mengapa paradoks itu ada: jauh lebih mudah untuk melatih "pesenam buta" daripada robot yang melihat dan memanipulasi. Yang pertama dapat diselesaikan sepenuhnya dalam simulasi dan ditransfer zero-shot ke dunia nyata, sementara yang terakhir menuntut rendering yang sangat realistis, fisika kontak, dan dinamika objek dunia nyata yang berantakan - tidak ada yang dapat disimulasikan dengan baik.
Bayangkan Anda dapat melatih LLM bukan dari internet, tetapi dari game konsol teks buatan tangan murni. Ahli robotika beruntung. Kita kebetulan hidup di dunia di mana mesin fisika yang dipercepat sangat bagus sehingga kita bisa lolos dengan akrobatik yang mengesankan menggunakan data nyata nol. Tetapi kami belum menemukan kode cheat yang sama untuk ketangkasan umum.
Sampai saat itu, kita masih akan ditanyai oleh orang tua kita yang bingung.
318,95K
Bar saya untuk AGI jauh lebih sederhana: AI memasak makan malam yang enak di rumah siapa pun untuk masakan apa pun. Tes Turing Fisik kemungkinan besar lebih sulit daripada Hadiah Nobel. Paradoks Moravec akan terus menghantui kita, menjulang lebih besar dan lebih gelap, selama dekade mendatang.

Thomas Wolf19 Jul, 16.06
Bar saya untuk AGI adalah AI yang memenangkan Hadiah Nobel untuk teori baru yang dimulainya.
99,02K
Saya agak diam di X baru-baru ini. Tahun lalu telah menjadi pengalaman transformasional. Grok-4 dan Kimi K2 luar biasa, tetapi dunia robotika adalah barat liar yang menakjubkan. Rasanya seperti NLP pada tahun 2018 ketika GPT-1 diterbitkan, bersama dengan BERT dan seribu bunga lainnya yang mekar. Tidak ada yang tahu mana yang pada akhirnya akan menjadi ChatGPT. Perdebatan memanas. Entropi setinggi langit. Ide-ide itu sangat menyenangkan.
Saya percaya GPT-1 robotika sudah ada di suatu tempat di Arxiv, tetapi kami tidak tahu persis yang mana. Bisa berupa model dunia, RL, belajar dari video manusia, sim2real, real2sim, dll. dll, atau kombo apa pun dari mereka. Perdebatan memanas. Entropi setinggi langit. Ide-ide sangat menyenangkan, alih-alih memeras beberapa % terakhir pada AIME & GPQA.
Sifat robotika juga sangat memperumit ruang desain. Tidak seperti dunia bit yang bersih untuk LLM (string teks), kami para ahli robotika harus berurusan dengan dunia atom yang berantakan. Lagi pula, ada segumpal logam yang ditentukan perangkat lunak dalam lingkaran. Norma LLM mungkin sulit untuk dipercaya, tetapi sejauh ini ahli robotika masih belum dapat menyetujui tolok ukur! Robot yang berbeda memiliki amplop kemampuan yang berbeda - beberapa lebih baik dalam akrobatik sementara yang lain dalam manipulasi objek. Beberapa dimaksudkan untuk penggunaan industri sementara yang lain untuk tugas rumah tangga. Perwujudan silang bukan hanya hal baru penelitian, tetapi fitur penting untuk otak robot universal.
Saya telah berbicara dengan lusinan C-suite lead dari berbagai perusahaan robot, lama dan baru. Beberapa menjual seluruh tubuh. Beberapa menjual bagian tubuh seperti tangan yang cekatan. Banyak lagi yang menjual sekop untuk memproduksi bodi baru, membuat simulasi, atau mengumpulkan banyak data. Ruang ide bisnis sama liarnya dengan penelitian itu sendiri. Ini adalah demam emas baru, seperti yang belum pernah kita lihat sejak gelombang ChatGPT 2022.
Waktu terbaik untuk masuk adalah ketika non-konsensus memuncak. Kita masih berada di awal kurva kerugian - ada tanda-tanda kehidupan yang kuat, tetapi jauh, jauh dari konvergensi. Setiap langkah gradien membawa kita ke tempat yang tidak diketahui. Tapi satu hal yang saya tahu pasti - tidak ada AGI tanpa menyentuh, merasakan, dan diwujudkan dalam dunia yang berantakan.
Pada catatan yang lebih pribadi - menjalankan laboratorium penelitian datang dengan tingkat tanggung jawab yang sama sekali baru. Memberikan pembaruan langsung kepada CEO perusahaan $ 4 triliun, secara halus, mendebarkan dan memakan beban perhatian saya. Lewatlah sudah hari-hari ketika saya bisa tetap di atas dan menyelami jauh ke dalam setiap berita AI.
Saya akan mencoba meluangkan waktu untuk berbagi lebih banyak perjalanan saya.

876,93K
Tes Turing Fisik: rumah Anda benar-benar berantakan setelah hackathon hari Minggu. Pada Senin malam, Anda pulang ke ruang tamu yang rapi dan makan malam dengan cahaya lilin. Dan Anda tidak bisa mengatakan apakah manusia atau mesin pernah ada di sana. Sederhana yang menipu, sangat keras.
Ini adalah Bintang Utara AI berikutnya. Mimpi yang membuat saya terjaga pukul 12 pagi di lab. Visi untuk platform komputasi berikutnya yang mengotomatiskan potongan atom, bukan potongan-potongan bit.
Terima kasih Sequoia telah menjamu saya di AI Ascent! Di bawah ini adalah pembicaraan lengkap saya tentang prinsip-prinsip pertama untuk memecahkan robotika tujuan umum: bagaimana kita berpikir tentang strategi data dan hukum penskalaan. Saya jamin Anda akan menjadi 17 menit yang tidak akan Anda sesali!
107,2K
Suatu hari dalam dekade berikutnya, kita akan memiliki robot di setiap rumah, setiap rumah sakit dan pabrik, melakukan setiap pekerjaan yang membosankan dan berbahaya dengan ketangkasan manusia super. Hari itu akan dikenal sebagai "Kamis". Bahkan Turing tidak akan berani memimpikan hidup kita dalam mimpinya yang paling liar.

signüll21 Apr 2025
Kami melewati tes Turing & tidak ada yang peduli. tidak ada parade. tidak ada judul halaman depan. saja... mengangkat bahu santai. Seperti "Oh ya, mesinnya cukup pintar untuk membodohi kita sekarang. Ngomong-ngomong, apa untuk makan siang?"
keheningan itu memberi tahu Anda segalanya tentang kecepatan yang kita gerakkan.
Kembali ke kelas CS saya, tes Turing diperlakukan seperti bos terakhir. Sekarang setiap terobosan adalah hari Selasa sialan lainnya.
101,93K
Olimpiade Humanoid pada tahun 2030 akan menjadi tontonan yang cukup

Jim Fan5 Feb 2025
Kami mengarahkan robot humanoid ke Cristiano Ronaldo, LeBron James, dan Kobe Byrant! Ini adalah jaringan saraf yang berjalan pada perangkat keras nyata di lab GEAR kami. Sebagian besar demo robot yang Anda lihat secara online mempercepat video. Kami benar-benar *memperlambatnya* sehingga Anda dapat menikmati gerakan yang lancar.
Saya dengan senang hati mengumumkan "ASAP", model "real2sim2real" yang menguasai gerakan yang sangat halus dan dinamis untuk kontrol seluruh tubuh humanoid.
Kami melatih robot terlebih dahulu dalam simulasi, tetapi ada celah "sim2real" yang terkenal: sangat sulit bagi persamaan fisika yang direkayasa dengan tangan untuk mencocokkan dinamika dunia nyata.
Perbaikan kami sederhana: cukup terapkan kebijakan yang telah dilatih sebelumnya pada perangkat keras nyata, kumpulkan data, dan putar ulang gerakan di sim. Tayangan ulang jelas akan memiliki banyak kesalahan, tetapi itu memberikan sinyal yang kaya untuk mengkompensasi perbedaan fisika. Gunakan jaring saraf lain untuk mempelajari delta. Pada dasarnya, kami "menambal" mesin fisika tradisional, sehingga robot dapat mengalami hampir dunia nyata dalam skala besar di GPU.
Masa depan adalah simulasi hibrida: menggabungkan kekuatan mesin sim klasik yang disempurnakan selama beberapa dekade dan kemampuan luar biasa NN modern untuk menangkap dunia yang berantakan.
45,81K
Kami mengarahkan robot humanoid ke Cristiano Ronaldo, LeBron James, dan Kobe Byrant! Ini adalah jaringan saraf yang berjalan pada perangkat keras nyata di lab GEAR kami. Sebagian besar demo robot yang Anda lihat secara online mempercepat video. Kami benar-benar *memperlambatnya* sehingga Anda dapat menikmati gerakan yang lancar.
Saya dengan senang hati mengumumkan "ASAP", model "real2sim2real" yang menguasai gerakan yang sangat halus dan dinamis untuk kontrol seluruh tubuh humanoid.
Kami melatih robot terlebih dahulu dalam simulasi, tetapi ada celah "sim2real" yang terkenal: sangat sulit bagi persamaan fisika yang direkayasa dengan tangan untuk mencocokkan dinamika dunia nyata.
Perbaikan kami sederhana: cukup terapkan kebijakan yang telah dilatih sebelumnya pada perangkat keras nyata, kumpulkan data, dan putar ulang gerakan di sim. Tayangan ulang jelas akan memiliki banyak kesalahan, tetapi itu memberikan sinyal yang kaya untuk mengkompensasi perbedaan fisika. Gunakan jaring saraf lain untuk mempelajari delta. Pada dasarnya, kami "menambal" mesin fisika tradisional, sehingga robot dapat mengalami hampir dunia nyata dalam skala besar di GPU.
Masa depan adalah simulasi hibrida: menggabungkan kekuatan mesin sim klasik yang disempurnakan selama beberapa dekade dan kemampuan luar biasa NN modern untuk menangkap dunia yang berantakan.
543,12K
Bahwa makalah *kedua* yang dijatuhkan dengan banyak rahasia roda gila RL dan penalaran gaya o1 *multimodal* tidak ada di kartu bingo saya hari ini. Makalah Kimi (startup lain) dan DeepSeek sangat menyatu pada temuan serupa:
> Tidak perlu pencarian pohon yang rumit seperti MCTS. Cukup linier jejak pikiran dan lakukan prediksi autoregresif lama yang baik;
> Tidak perlu fungsi nilai yang memerlukan salinan model mahal lainnya;
> Tidak perlu pemodelan hadiah yang padat. Andalkan sebanyak mungkin pada groundtruth, hasil akhir.
Perbedaan:
> DeepSeek melakukan pendekatan AlphaZero - murni bootstrap melalui RL tanpa input manusia, yaitu "start dingin". Kimi melakukan pendekatan AlphaGo-Master: SFT ringan untuk memanaskan melalui jejak CoT yang direkayasa dengan cepat.
> bobot DeepSeek adalah lisensi MIT (kepemimpinan pemikiran!); Kimi belum memiliki rilis model.
> Kimi menunjukkan kinerja multimoda yang kuat (!) pada tolok ukur seperti MathVista, yang membutuhkan pemahaman visual tentang geometri, tes IQ, dll.
> makalah Kimi memiliki BANYAK detail lebih banyak tentang desain sistem: infrastruktur RL, kluster hibrida, kotak pasir kode, strategi paralelisme; dan detail pembelajaran: konteks panjang, kompresi CoT, kurikulum, strategi pengambilan sampel, pembuatan kasus uji, dll.
Bacaan optimis saat liburan!

300,42K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal