Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Atualização de vida: Decidi deixar a 1X.
Foi uma honra ajudar a crescer a empresa. Entrei na Halodi Robotics em 2022 (nome anterior da empresa) como o único funcionário baseado na Califórnia. Na época, éramos cerca de 40 baseados na Noruega e 2 no Texas. Meu primeiro contratado e eu trabalhamos da minha garagem por alguns meses para economizar dinheiro. Hoje, a 1X tem centenas de pessoas, com hardware, design, software, IA, fabricação e produto todos relocados para a área da baía de SF, funcionando a todo vapor e trabalhando para preparar o NEO para o lar. Um grande obrigado a todos os meus colegas com quem trabalhei.
Foi uma decisão difícil deixar. Quando se trabalha em uma startup empolgante que está crescendo rapidamente, há sempre tanto a fazer e nunca um momento perfeito para seguir em frente. Temos vários trabalhos em andamento que são tão empolgantes porque avançam muito a autonomia geral e a escalabilidade da nossa abordagem de implantação e realmente mostram um caminho realista para o produto funcionar. A recente atualização de autonomia do Modelo Mundial é um exemplo, e há mais por vir. A fábrica da 1X é tão empolgante. As coisas estão acelerando a uma velocidade que eu teria ficado surpreso há alguns anos.
Em 2022, a maioria dos tecnólogos, pesquisadores e VCs eram céticos em relação a humanoides e aprendizado por imitação em larga escala. "Por que pernas?" "Como o aprendizado de ponta a ponta poderia ser bom o suficiente?" "Por que ir para o lar e não para a fábrica?" "Como conseguiremos reunir dados suficientes?"
A janela de Overton sobre robótica de propósito geral mudou muito desde então. Embora ainda estejamos no início da nossa missão, continuo confiante de que em breve, robôs domésticos serão tão comuns quanto condicionadores de ar, carros e ChatGPT. Basta conversar com o robô, e ele irá e fará isso silenciosamente. Economias inteiras eventualmente se reorganizarão em torno dessa tecnologia. As pessoas entendem isso agora.
Qual é o próximo passo?
Acredito que o progresso em aprendizado profundo aplicado geralmente depende de "aproveitar a mágica" de alguns objetos mágicos. Esses objetos mágicos possuem muito mais poder de generalização do que se poderia normalmente esperar. Apenas pedir ao LLM para entender o que você quer é mágica. Modelos de geração de vídeo são mágicos. Raciocínio é mágico. Você não encontra um objeto mágico todos os dias, mas quando encontra, garante que o pegue e o coloque para trabalhar para fazer algo útil no robô de alguma forma.
Muita da minha convicção inicial sobre para onde a robótica estava indo veio do trabalho no BC-Z de 2018 a 2021. O "objeto mágico" no qual apostei na época foi as surpreendentes capacidades de absorção de dados do aprendizado supervisionado e "basta pedir por generalização". Isso pioneirou muitos dos ingredientes padrão que vemos em VLAs hoje:
- Generalização para comandos de linguagem não vistos
- DAgger guiado por humanos para melhoria de políticas
- Previsões auxiliares de loop aberto + controle de horizonte recuado, também conhecido como chunking de ação
- Pontos-chave de manipulação para melhorar o servo
- ResNet18 simples com condicionamento FiLM em entradas multimodais
O próximo "objeto mágico" no qual apostamos na 1X foram os modelos de vídeo, porque são claramente objetos mágicos que aprendem uma distribuição de dados não muito diferente do que um robô precisa aprender. Eles generalizam surpreendentemente bem.
Mais uma vez, sinto que há mais objetos mágicos em jogo agora, o que abre muitas novas possibilidades para a robótica e além. Estou tirando alguns meses para esvaziar meu copo de pré-conceitos e ganhar uma nova perspectiva. Quando deixei o Google em 2022, passei cerca de 2 semanas decidindo o que fazer a seguir. Desta vez, quero levar muito mais tempo para entender o que aconteceu no espaço mais amplo de IA + robótica.
Tenho reimplementado alguns artigos de aprendizado profundo. Estou trabalhando em um grande tutorial para meu blog. Estou aprendendo todos os truques de usuário avançado do Claude. Estou lendo os posts do blog Thinking Machines para entender que tipos de experimentos estão sendo realizados em laboratórios de ponta. Estou lendo a tese de 2016 de Ben Katz sobre o atuador Mini-cheetah. Estou viajando para a China em março para conhecer empresas incríveis no ecossistema de robótica chinês. Agora, mais do que nunca, é hora de humanos e máquinas aprenderem. O próximo token da minha sequência de vida será um importante.
Aos colegas e investidores que apostaram na 1X cedo, mesmo antes de nos tornarmos um nome conhecido - agradeço do fundo do meu coração. Não vou esquecer isso♥️
Top
Classificação
Favoritos
