Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Atualização da vida: decidi sair do 1X.
Tem sido uma honra ajudar a fazer a empresa crescer. Entrei na Halodi Robotics em 2022 (nome anterior da empresa) como o único funcionário baseado na Califórnia. Na época, éramos cerca de 40 baseados na Noruega e 2 no Texas. Minha primeira contratação e eu trabalhamos na minha garagem por alguns meses para economizar dinheiro. Hoje, a 1X tem centenas de pessoas, com hardware, design, software, IA, manufatura e produtos todos realocados para a região da Baía de São Francisco, funcionando a todo vapor e trabalhando para preparar o NEO para casa. Um grande obrigado a todos os meus colegas com quem trabalhei.
Foi uma decisão difícil sair. Quando se trabalha em uma startup empolgante que está crescendo rápido, sempre há muito o que fazer e nunca um momento perfeito para seguir em frente. Temos vários trabalhos em andamento que são muito empolgantes porque avançam muito a autonomia geral e a escalabilidade da nossa abordagem de implantação e realmente mostram um caminho realista para o produto funcionar. A recente atualização de autonomia do Modelo Mundial é um exemplo, e há mais a caminho. A fábrica 1X é muito empolgante. As coisas estão acelerando em uma velocidade que eu teria me surpreendido alguns anos atrás.
Em 2022, a maioria dos tecnólogos, pesquisadores e VCs estava cética em relação a humanoides e ao aprendizado de imitação em larga escala. "Por que pernas?" "Como o aprendizado de ponta a ponta poderia ser bom o suficiente?" "Por que ir para a casa e não para a fábrica?" "Como vamos coletar dados suficientes?"
A janela de Overton para robótica de uso geral mudou bastante desde então. Embora ainda estejamos no início da missão, continuo confiante de que em breve robôs domésticos serão tão comuns quanto ar-condicionados, carros e ChatGPT. Basta conversar com o bot, e ele vai resolver silenciosamente. Economias inteiras eventualmente se reorganizarão em torno dessa tecnologia. As pessoas entendem agora.
E agora?
Acredito que o progresso no deep learning aplicado geralmente depende de "aproveitar a magia" de alguns objetos mágicos. Esses objetos mágicos possuem muito mais poder de generalização do que normalmente se esperaria. Só pedir ao LLM para entender o que você quer já é mágica. Modelos de geração de vídeo são mágicos. Raciocínio é mágica. Você não encontra um objeto mágico todo dia, mas quando encontra, você se certifica de pegá-lo e colocá-lo para trabalhar para criar algo útil no robô de alguma forma.
Grande parte da minha convicção inicial sobre para onde a robótica estava indo foi trabalhando com BC-Z de 2018 a 2021. O "objeto mágico" em que apostei na época foram as surpreendentes capacidades de absorção de dados do aprendizado supervisionado e do "pedir generalização". Isso foi pioneiro em muitos dos ingredientes padrão que vemos nos VLAs hoje:
- Generalização para comandos de linguagem não vistos
- DAgger Guiado por Humanos para melhoria de políticas
- Previsões auxiliares em malha aberta + controle do horizonte recuante, também conhecido como fragmentação de ação
- Manipulação de pontos-chave para melhorar a servoização
- Simple ResNet18 com condicionamento FiLM em entradas multimodais
O próximo "objeto mágico" em que apostamos na 1X foram os modelos de vídeo, porque são claramente objetos mágicos que aprendem uma distribuição de dados não muito diferente do que um robô precisa aprender. Eles generalizam surpreendentemente bem.
Mais uma vez sinto que há mais objetos mágicos em jogo agora, o que abre muitas novas possibilidades para a robótica e além. Estou tirando alguns meses para esvaziar meu copo de antecedentes e ganhar uma nova perspectiva. Quando saí do Google em 2022, passei cerca de 2 semanas decidindo o que fazer a seguir. Desta vez, quero dedicar muito mais tempo para colocar em dia o que aconteceu no espaço mais amplo de IA + robótica.
Tenho reimplementado alguns artigos de deep learning. Estou trabalhando em um grande tutorial para o meu blog. Estou aprendendo todos os truques do Claude para usuários avançados. Estou lendo os posts do blog Thinking Machines para entender que tipos de experimentos estão sendo realizados nos laboratórios da Frontier. Estou lendo a tese de 2016 do Ben Katz sobre o atuador Mini-guepardo. Vou viajar para a China em março para conhecer empresas incríveis do ecossistema robótico chinês. Agora, mais do que nunca, é hora de humanos e máquinas aprenderem. O próximo símbolo da minha sequência de vida será importante.
Aos colegas e investidores que apostaram no 1X cedo, mesmo antes de nos tornarmos um nome conhecido – agradeço do fundo do coração. Não vou esquecer♥️
Melhores
Classificação
Favoritos
