Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

A OpenAI acabou de confirmar minha tese de estrela do norte para IA hoje, lançando seu agente operador. Não só esta foi a minha tese orientadora para $CODEC, mas todos os outros investimentos em IA que fiz, incluindo os do início do ano durante a mania de IA. Tem havido muita discussão com o Codec em relação à Robótica, enquanto essa vertical terá sua própria narrativa muito em breve, a razão subjacente pela qual eu estava tão otimista com o Codec a partir do dia 1 é devido à forma como sua arquitetura capacita os agentes operadores. As pessoas ainda subestimam o quanto de participação de mercado está em jogo, construindo software que funciona de forma autônoma, superando os trabalhadores humanos sem a necessidade de solicitações constantes ou supervisão. Já vi muitas comparações com $NUIT. Em primeiro lugar, quero dizer que sou um grande fã do que Nuit está construindo e não desejo nada além de seu sucesso. Se você digitar "nuit" no meu telegrama, verá que em abril eu disse que se eu tivesse que segurar uma moeda por vários meses teria sido Nuit devido à minha tese de operador. Nuit foi o projeto de operador mais promissor no papel, mas depois de uma extensa pesquisa, descobri que sua arquitetura não tinha a profundidade necessária para justificar um grande investimento ou colocar minha reputação por trás dele. Com isso em mente, eu já estava ciente das lacunas arquitetônicas nas equipes de agentes operacionais existentes e procurando ativamente um projeto que as abordasse. Pouco depois Codec apareceu (graças a @0xdetweiler insistindo que eu olhar mais fundo neles) e esta é a diferença entre os dois: $CODEC vs $NUIT A arquitetura do Codec é construída em três camadas; Máquina, Sistema e Inteligência, que separam infraestrutura, interface de ambiente e lógica de IA. Cada agente de operador no Codec é executado em sua própria VM ou contêiner isolado, permitindo desempenho quase nativo e isolamento de falhas. Este design em camadas significa que os componentes podem ser dimensionados ou evoluídos de forma independente sem quebrar o sistema. A arquitetura de Nuit toma um caminho diferente por ser mais monolítica. Sua pilha gira em torno de um agente de navegador da Web especializado que combina análise, raciocínio de IA e ação. Ou seja, eles analisam profundamente páginas da web em dados estruturados para a IA consumir e dependem do processamento em nuvem para tarefas pesadas de IA. A abordagem do Codec de incorporar um modelo leve de Visão-Linguagem-Ação (VLA) em cada agente significa que ele pode ser executado totalmente local. O que não requer ping constante de volta à nuvem para obter instruções, cortando a latência e evitando a dependência do tempo de atividade e da largura de banda. O agente do Nuit processa tarefas primeiro convertendo páginas da web em um formato semântico e, em seguida, usando um cérebro LLM para descobrir o que fazer, o que melhora com o tempo com a aprendizagem por reforço. Embora seja eficaz para a automação da web, esse fluxo depende do processamento pesado de IA do lado da nuvem e de estruturas de página predefinidas. A inteligência de dispositivo local do Codec significa que as decisões acontecem mais perto dos dados, reduzindo a sobrecarga e tornando o sistema mais estável a alterações inesperadas (sem scripts frágeis ou suposições DOM). Os operadores do Codec seguem um loop contínuo de percepção-pensar-agir. A camada de máquina transmite o ambiente (por exemplo, um aplicativo ao vivo ou alimentação de robô) para a camada de inteligência através dos canais otimizados da camada do sistema, dando à IA "olhos" sobre o estado atual. O modelo VLA do agente então interpreta os visuais e as instruções juntos para decidir sobre uma ação, que a camada System executa por meio de eventos de teclado/mouse ou controle do robô. Esse loop integrado significa que ele se adapta a eventos ao vivo, mesmo que a interface do usuário mude, você não quebrará o fluxo. Para colocar tudo isso em uma analogia mais simples, pense nos operadores da Codec como um funcionário autossuficiente que se adapta às surpresas no trabalho. O agente de Nuit é como um funcionário que precisa fazer uma pausa, descrever a situação a um supervisor por telefone e esperar por instruções. Sem cair muito na toca do coelho técnico, isso deve lhe dar uma ideia de alto nível sobre por que eu escolhi o Codec como minha principal aposta em Operadores. Yes Nuit tem o apoio de YC, uma equipe empilhada e github de nível S. Embora a arquitetura do Codec tenha sido construída com o dimensionamento horizontal em mente, o que significa que você pode implantar milhares de agentes em paralelo com zero memória compartilhada ou contexto de execução entre agentes. A equipe da Codec também não é sua média de devs. Sua arquitetura VLA abre uma infinidade de casos de uso que não era possível com modelos de agentes anteriores devido à visualização através de pixels, não capturas de tela. Eu poderia continuar, mas vou guardar isso para posts futuros.

Ambientes Virtuais para Agentes Operadores: $CODEC Minha tese central em torno da explosão da IA sempre se centrou na ascensão dos agentes operadores. Mas para que esses agentes tenham sucesso, eles precisam de acesso profundo ao sistema, concedendo-lhes efetivamente controle sobre seu computador pessoal e dados confidenciais, o que introduz sérias preocupações de segurança. Já vimos como empresas como a OpenAI e outros gigantes da tecnologia lidam com os dados dos usuários. Enquanto a maioria das pessoas não se importa, os indivíduos que mais se beneficiam dos agentes operadores, o 1% mais rico absolutamente se importa. Pessoalmente, não há nenhuma chance de eu estar dando a uma empresa como a OpenAI acesso total à minha máquina, mesmo que isso signifique um aumento de 10× na produtividade. Então, por que Codec? A arquitetura da Codec está centrada no lançamento de "desktops em nuvem" isolados e sob demanda para agentes de IA. Em seu núcleo está um serviço de orquestração baseado em Kubernetes (codinome Captain) que provisiona máquinas virtuais (VMs) leves dentro de pods do Kubernetes. Cada agente obtém seu próprio ambiente isolado no nível do sistema operacional (uma instância completa do sistema operacional Linux) onde pode executar aplicativos, navegadores ou qualquer código, completamente em área restrita de outros agentes e do host. O Kubernetes lida com agendamento, dimensionamento automático e autorrecuperação desses pods de agente, garantindo confiabilidade e a capacidade de girar para cima/para baixo muitas instâncias do agente conforme as demandas de carga Os Ambientes de Execução Confiáveis (TEEs) são usados para proteger essas VMs, o que significa que a máquina do agente pode ser isolada criptograficamente, sua memória e execução podem ser protegidas do sistema operacional host ou do provedor de nuvem. Isso é crucial para tarefas confidenciais: por exemplo, uma VM em execução em um enclave pode conter chaves de API ou segredos de carteira de criptografia com segurança. Quando um agente de IA (um "cérebro" baseado em LLM) precisa executar ações, ele envia solicitações de API para o serviço Captain, que então inicia ou gerencia o pod de VM do agente. O fluxo de trabalho: o agente solicita uma máquina, o Captain (através do Kubernetes) aloca um pod e anexa um volume persistente (para o disco da VM). O agente pode então se conectar à sua VM (por meio de um canal seguro ou interface de streaming) para emitir comandos. O Captain expõe pontos de extremidade para que o agente execute comandos shell, carregue/baixe arquivos, recupere logs e até crie instantâneos da VM para restauração posterior. Esse design dá ao agente um sistema operacional completo para trabalhar, mas com acesso controlado e auditado. Como é construído no Kubernetes, o Codec pode dimensionar automaticamente horizontalmente, se 100 agentes precisarem de ambientes, ele pode agendar 100 pods em todo o cluster e lidar com falhas reiniciando pods. A VM do agente pode ser equipada com vários servidores MCP (como uma "porta USB" para IA). Por exemplo, o módulo Conductor do Codec é um contêiner que executa um navegador Chrome junto com um servidor Microsoft Playwright MCP para controle do navegador. Isso permite que um agente de IA abra páginas da web, clique em links, preencha formulários e raspe conteúdo por meio de chamadas MCP padrão, como se fosse um humano controlando o navegador. Outras integrações MCP podem incluir um MCP de sistema de arquivos/terminal (para permitir que um agente execute comandos da CLI com segurança) ou MCPs específicos do aplicativo (para APIs de nuvem, bancos de dados, etc.). Essencialmente, o Codec fornece os "wrappers" de infraestrutura (VMs, enclaves, rede) para que os planos de agentes de alto nível possam ser executados com segurança em software e redes reais. Casos de uso Automação da carteira: O Codec pode incorporar carteiras ou chaves dentro de uma VM protegida por TEE, permitindo que um agente de IA interaja com redes blockchain (negocie em DeFi, gerencie criptoativos) sem expor chaves secretas. Essa arquitetura permite que agentes financeiros onchain executem transações reais com segurança, algo que seria muito perigoso em uma configuração típica de agente. O slogan da plataforma lista explicitamente o suporte para "carteiras" como um recurso chave. Um agente pode, por exemplo, executar uma CLI para uma carteira Ethereum dentro de seu enclave, assinar transações e enviá-las, com a garantia de que, se o agente se comportar mal, ficará confinado à sua VM e as chaves nunca sairão da TEE. Browser e Automação Web: Os agentes CodecFlow podem controlar navegadores da Web completos em suas VMs. O exemplo do Conductor demonstra um agente iniciando o Chrome e transmitindo sua tela para o Twitch em tempo real. Através do Playwright MCP, o agente pode navegar em sites, clicar em botões e extrair dados como um usuário humano. Isso é ideal para tarefas como raspagem da web atrás de logins, transações da web automatizadas ou teste de aplicativos da web. As estruturas tradicionais geralmente dependem de chamadas de API ou scripts de navegador simples sem cabeça; em contraste, o CodecFlow pode executar um navegador real com uma interface do usuário visível, tornando mais fácil lidar com aplicativos Web complexos (por exemplo, com desafios pesados de JavaScript ou CAPTCHA) sob controle de IA. Automação de GUI do mundo real (sistemas legados): Como cada agente tem um sistema operacional de desktop real, ele pode automatizar aplicativos GUI herdados ou sessões de área de trabalho remota, funcionando essencialmente como automação de processos robóticos (RPA), mas impulsionada por IA. Por exemplo, um agente pode abrir uma planilha do Excel em sua VM do Windows ou fazer interface com um aplicativo de terminal antigo que não tenha API. O site da Codec menciona explicitamente a habilitação da "automação legada". Isso abre o uso de IA para operar software que não é acessível por meio de APIs modernas, uma tarefa que seria muito hackeada ou insegura sem um ambiente contido. A integração noVNC incluída sugere que os agentes podem ser observados ou controlados via VNC, o que é útil para monitorar uma IA dirigindo uma GUI. Simulando fluxos de trabalho SaaS: As empresas geralmente têm processos complexos que envolvem vários aplicativos SaaS ou sistemas legados. por exemplo, um funcionário pode pegar dados do Salesforce, combiná-los com dados de um ERP interno e, em seguida, enviar um resumo por e-mail para um cliente. O Codec pode permitir que um agente de IA execute toda essa sequência, realmente fazendo login nesses aplicativos por meio de um navegador ou software cliente em sua VM, como um ser humano faria. Isso é como RPA, mas alimentado por um LLM que pode tomar decisões e lidar com a variabilidade. É importante ressaltar que as credenciais para esses aplicativos podem ser fornecidas à VM com segurança (e até mesmo incluídas em um TEE), para que o agente possa usá-las sem nunca "ver" credenciais de texto sem formatação ou expô-las externamente. Isso poderia acelerar a automação de tarefas rotineiras de back office e, ao mesmo tempo, satisfazer a TI que cada agente executa com o mínimo de privilégios e total auditabilidade (já que cada ação na VM pode ser registrada ou registrada). Roteiro - Lançamento de demonstração pública no final do mês - Comparação de recursos com outras plataformas similares (sem concorrente web3) - Integração do GAT - Grande Parceria de Jogos Em termos de originalidade, o Codec é construído sobre uma base de tecnologias existentes, mas as integra de uma maneira inovadora para o uso de agentes de IA. A ideia de ambientes de execução isolados não é nova (contêineres, VMs e TEEs são padrão na computação em nuvem), mas aplicá-los a agentes autônomos de IA com uma camada de API contínua (MCP) é extremamente novo. A plataforma aproveita padrões e ferramentas abertas sempre que possível: usa servidores MCP como o Playwright da Microsoft para controle de navegadores, em vez de reinventar essa roda, e planeja oferecer suporte às micro-VMs Firecracker da AWS para uma virtualização mais rápida. Ele também bifurcou soluções existentes, como noVNC para streaming de desktops. Demonstrar o projeto está se apoiando nas bases de tecnologia comprovada (Kubernetes, hardware de enclave, bibliotecas de código aberto), focando seu desenvolvimento original na lógica de cola e orquestração (o "molho secreto" é como tudo funciona em conjunto). A combinação de componentes de código aberto e um futuro serviço de nuvem (sugerido pela menção de um utilitário de token $CODEC e acesso público ao produto) significa que o Codec em breve estará acessível em várias formas (tanto como um serviço quanto como auto-hospedado). Equipa Moyai: 15+ anos de experiência em desenvolvimento, atualmente liderando o desenvolvimento de IA na Elixir Games. lil'km: 5+ anos desenvolvedor de IA, atualmente trabalhando com HuggingFace no projeto LeRobot. A HuggingFace é uma grande empresa de robótica e Moyai trabalha como chefe de inteligência artificial na elixir games (apoiada pela Square Enix e Solanafdn. Eu pessoalmente liguei para toda a equipe e realmente gostei da energia que eles trazem. Meu amigo que os colocou no meu radar também conheceu todos eles no Token2049 e só tinha coisas boas a dizer. Considerações Finais Ainda há muito para cobrir, que guardarei para futuras atualizações e postagens no meu canal do Telegram. Há muito tempo acredito que a infraestrutura de nuvem é o futuro para os agentes da operadora. Eu sempre respeitei o que Nuit está construindo, mas Codec é o primeiro projeto que me mostrou a convicção full-stack que eu estava procurando. A equipa é claramente composta por engenheiros de topo. Eles disseram abertamente que o marketing não é sua força, e é provavelmente por isso que isso voou sob o radar. Trabalharei em estreita colaboração com eles para ajudar a moldar a estratégia GTM que realmente reflita a profundidade do que eles estão construindo. Com um valor de mercado de US$ 4 mil e esse nível de infraestrutura, parece extremamente subfaturado. Se eles puderem entregar um produto utilizável, acho que isso poderia facilmente marcar o início do próximo ciclo de infra de IA. Como sempre, há risco e, embora eu tenha examinado a equipe furtivamente nas últimas semanas, nenhum projeto é completamente à prova de tapete. Preços-alvo? Muito maior.

Tldr sobre por que eu escolhi Codec > Nuit para operadores: O Codec usa uma arquitetura de três camadas (Máquina, Sistema, Inteligência) permitindo agentes isolados e de alto desempenho com controle nativo. Cada agente Codec é executado localmente usando um loop Vision-Language-Action (VLA), reduzindo a latência e aumentando a confiabilidade. O modelo do Nuit depende da análise do navegador + chamadas de IA na nuvem, o que limita a flexibilidade e introduz fragilidade. O codec é dimensionado horizontalmente em milhares de agentes, sem estado compartilhado e modularidade tolerante a falhas.

2,87K

Top

Classificação

Favoritos