Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Diretor de Robótica e Cientista Distinto da NVIDIA. Co-líder do laboratório GEAR. Resolvendo AGI Física, um motor de cada vez. Stanford Ph.D. 1º estagiário da OpenAI.
Estou observando um mini paradoxo de Moravec dentro da robótica: a ginástica que é difícil para os humanos é muito mais fácil para os robôs do que tarefas "pouco sexy" como cozinhar, limpar e montar. Isso leva a uma dissonância cognitiva para pessoas de fora do campo, "então, os robôs podem fazer parkour e breakdance, mas por que eles não podem cuidar do meu cachorro?" Acredite em mim, meus pais me perguntaram sobre isso mais do que você pensa ...
O "paradoxo do robô Moravec" também cria a ilusão de que os recursos físicos de IA são muito mais avançados do que realmente são. Não estou destacando o Unitree, pois ele se aplica amplamente a todas as demos acrobáticas recentes da indústria. Aqui está um teste simples: se você montar uma parede na frente do robô que vira de lado, ele vai bater nela com força total e fazer um espetáculo. Porque é apenas sobreajustar aquele único movimento de referência, sem qualquer consciência do ambiente.
Eis por que o paradoxo existe: é muito mais fácil treinar um "ginasta cego" do que um robô que vê e manipula. O primeiro pode ser resolvido inteiramente em simulação e transferido para o mundo real, enquanto o último exige renderização extremamente realista, física de contato e dinâmica de objetos do mundo real confusa - nenhum dos quais pode ser bem simulado.
Imagine que você pode treinar LLMs não da Internet, mas de um jogo de console de texto puramente feito à mão. Os roboticistas tiveram sorte. Acontece que vivemos em um mundo onde os motores de física acelerada são tão bons que podemos nos safar com acrobacias impressionantes usando literalmente zero dados reais. Mas ainda não descobrimos o mesmo código de trapaça para destreza geral.
Até lá, ainda seremos questionados por nossos pais confusos.
318,95K
Meu bar para AGI é muito mais simples: uma IA cozinhando um bom jantar na casa de qualquer pessoa para qualquer cozinha. O Teste de Turing Físico é muito provavelmente mais difícil do que o Prêmio Nobel. O paradoxo de Moravec continuará a nos assombrar, parecendo maior e mais sombrio, na próxima década.

Thomas Wolf19 de jul., 16:06
Minha barra para AGI é uma IA ganhando um Prêmio Nobel por uma nova teoria que originou.
99,02K
Eu estive um pouco quieto em X recentemente. O ano passado foi uma experiência transformadora. Grok-4 e Kimi K2 são incríveis, mas o mundo da robótica é um maravilhoso oeste selvagem. Parece PNL em 2018, quando GPT-1 foi publicado, junto com BERT e milhares de outras flores que floresceram. Ninguém sabia qual deles acabaria se tornando o ChatGPT. Os debates foram acalorados. A entropia estava nas alturas. As ideias eram incrivelmente divertidas.
Acredito que o GPT-1 da robótica já está em algum lugar no Arxiv, mas não sabemos exatamente qual. Podem ser modelos de mundo, RL, aprendendo com vídeo humano, sim2real, real2sim, etc. etc, ou qualquer combinação deles. Os debates são acalorados. A entropia é altíssima. As ideias são insanamente divertidas, em vez de espremer os últimos % no AIME e no GPQA.
A natureza da robótica também complica muito o espaço de design. Ao contrário do mundo limpo de bits para LLMs (strings de texto), nós, roboticistas, temos que lidar com o mundo confuso dos átomos. Afinal, há um pedaço de metal definido por software no circuito. Os normies do LLM podem achar difícil de acreditar, mas até agora os roboticistas ainda não conseguem chegar a um acordo sobre um benchmark! Robôs diferentes têm envelopes de capacidade diferentes - alguns são melhores em acrobacias, enquanto outros na manipulação de objetos. Alguns são destinados ao uso industrial, enquanto outros são para tarefas domésticas. A incorporação cruzada não é apenas uma novidade de pesquisa, mas uma característica essencial para um cérebro de robô universal.
Conversei com dezenas de líderes de alto escalão de várias empresas de robôs, antigas e novas. Alguns vendem o corpo inteiro. Alguns vendem partes do corpo, como mãos hábeis. Muitos outros vendem as pás para fabricar novos corpos, criar simulações ou coletar grandes quantidades de dados. O espaço da ideia de negócio é tão selvagem quanto a própria pesquisa. É uma nova corrida do ouro, como não víamos desde a onda do ChatGPT de 2022.
O melhor momento para entrar é quando o não consenso atinge o pico. Ainda estamos no início de uma curva de perda - há fortes sinais de vida, mas muito, muito longe da convergência. Cada passo do gradiente nos leva ao desconhecido. Mas uma coisa eu sei com certeza - não há AGI sem tocar, sentir e ser incorporado no mundo bagunçado.
Em uma nota mais pessoal - administrar um laboratório de pesquisa vem com um nível totalmente novo de responsabilidade. Dar atualizações diretamente ao CEO de uma empresa de US $ 4 trilhões é, para dizer o mínimo, emocionante e consumir tudo dos meus pesos de atenção. Já se foram os dias em que eu podia ficar por dentro e mergulhar fundo em todas as notícias de IA.
Vou tentar arranjar tempo para compartilhar mais da minha jornada.

876,93K
O Teste de Turing Físico: sua casa está uma bagunça completa depois de um hackathon de domingo. Na segunda-feira à noite, você chega em casa para uma sala de estar imaculada e um jantar à luz de velas. E você não poderia dizer se um humano ou uma máquina estava lá. Enganosamente simples, insanamente difícil.
É a próxima Estrela do Norte da IA. O sonho que me mantém acordado às 12 da manhã no laboratório. A visão para a próxima plataforma de computação que automatiza pedaços de átomos em vez de pedaços de bits.
Obrigado Sequoia por me hospedar no AI Ascent! Abaixo está minha palestra completa sobre os primeiros princípios para resolver a robótica de uso geral: como pensamos sobre a estratégia de dados e as leis de dimensionamento. Garanto que serão 17 minutos que você não se arrepende!
107,2K
Algum dia, na próxima década, teremos robôs em todas as casas, hospitais e fábricas, fazendo todos os trabalhos maçantes e perigosos com destreza sobre-humana. Esse dia será conhecido como "quinta-feira". Nem mesmo Turing ousaria sonhar com nossa vida em seus sonhos mais loucos.

signüll21 de abr. de 2025
Cruzamos o teste de Turing e ninguém se importou. sem desfiles. sem manchetes de primeira página. só... um encolher de ombros casual. Como "oh sim, as máquinas são inteligentes o suficiente para nos enganar agora. De qualquer forma, o que há para o almoço?"
Esse silêncio diz tudo sobre o ritmo em que estamos nos movendo.
De volta às minhas aulas de CS, o teste de Turing foi tratado como o chefe final. Agora, cada avanço é outra maldita terça-feira.
101,93K
Olimpíadas humanóides em 2030 serão um espetáculo e tanto

Jim Fan5 de fev. de 2025
Nós trocamos robôs humanóides para Cristiano Ronaldo, LeBron James e Kobe Byrant! Estas são redes neurais rodando em hardware real em nosso laboratório GEAR. A maioria das demonstrações de robôs que você vê online acelera os vídeos. Na verdade, nós * desaceleramos * para que você possa aproveitar os movimentos fluidos.
Estou animado para anunciar "ASAP", um modelo "real2sim2real" que domina movimentos extremamente suaves e dinâmicos para controle de corpo inteiro humanóide.
Nós pré-treinamos o robô na simulação primeiro, mas há uma lacuna notória "sim2real": é muito difícil para as equações físicas projetadas à mão corresponderem à dinâmica do mundo real.
Nossa correção é simples: basta implantar uma política pré-treinada em hardware real, coletar dados e reproduzir o movimento no simulador. O replay obviamente terá muitos erros, mas isso dá um sinal rico para compensar a discrepância física. Use outra rede neural para aprender o delta. Basicamente, "consertamos" um mecanismo de física tradicional, para que o robô possa experimentar quase o mundo real em escala em GPUs.
O futuro é a simulação híbrida: combine o poder dos mecanismos de simulação clássicos refinados ao longo de décadas e a incrível capacidade dos NNs modernos de capturar um mundo confuso.
45,81K
Nós trocamos robôs humanóides para Cristiano Ronaldo, LeBron James e Kobe Byrant! Estas são redes neurais rodando em hardware real em nosso laboratório GEAR. A maioria das demonstrações de robôs que você vê online acelera os vídeos. Na verdade, nós * desaceleramos * para que você possa aproveitar os movimentos fluidos.
Estou animado para anunciar "ASAP", um modelo "real2sim2real" que domina movimentos extremamente suaves e dinâmicos para controle de corpo inteiro humanóide.
Nós pré-treinamos o robô na simulação primeiro, mas há uma lacuna notória "sim2real": é muito difícil para as equações físicas projetadas à mão corresponderem à dinâmica do mundo real.
Nossa correção é simples: basta implantar uma política pré-treinada em hardware real, coletar dados e reproduzir o movimento no simulador. O replay obviamente terá muitos erros, mas isso dá um sinal rico para compensar a discrepância física. Use outra rede neural para aprender o delta. Basicamente, "consertamos" um mecanismo de física tradicional, para que o robô possa experimentar quase o mundo real em escala em GPUs.
O futuro é a simulação híbrida: combine o poder dos mecanismos de simulação clássicos refinados ao longo de décadas e a incrível capacidade dos NNs modernos de capturar um mundo confuso.
543,12K
Que um * segundo * papel caiu com toneladas de segredos do volante RL e raciocínio * multimodal * no estilo o1 não está no meu cartão de bingo hoje. Os artigos de Kimi (outra startup) e DeepSeek convergiram notavelmente em descobertas semelhantes:
> Não há necessidade de pesquisa de árvore complexa como o MCTS. Apenas linearize o traço de pensamento e faça a boa e velha previsão autorregressiva;
> Não há necessidade de funções de valor que exijam outra cópia cara do modelo;
> Não há necessidade de modelagem de recompensa densa. Confie o máximo possível na verdade do terreno, no resultado final.
Diferenças:
> DeepSeek faz a abordagem AlphaZero - puramente bootstrap através de RL sem entrada humana, ou seja, "inicialização a frio". Kimi faz a abordagem AlphaGo-Master: SFT leve para aquecer por meio de rastreamentos CoT projetados por prompt.
> pesos do DeepSeek são licença MIT (liderança de pensamento!); Kimi ainda não tem um lançamento de modelo.
> Kimi mostra um forte desempenho multimodal (!) em benchmarks como o MathVista, que requer compreensão visual de geometria, testes de QI, etc.
> artigo Kimi tem MUITO mais detalhes sobre o design do sistema: infraestrutura RL, cluster híbrido, sandbox de código, estratégias de paralelismo; e detalhes de aprendizagem: contexto longo, compressão CoT, currículo, estratégia de amostragem, geração de casos de teste, etc.
Leituras otimistas em um feriado!

300,42K
Melhores
Classificação
Favoritos
Em alta on-chain
Em alta no X
Principais fundos da atualidade
Mais notável