Pesquisa impressionante sobre raciocínio agential para LLMs. (marca este) 135+ páginas! Por que isso importa? LLMs raciocinham bem em ambientes de mundo fechado, mas têm dificuldades em ambientes abertos e dinâmicos onde a informação evolui. A peça que falta é a ação. Isso ocorre porque o raciocínio estático sem interação não pode se adaptar, aprender ou melhorar a partir do feedback. Esta nova pesquisa sistematiza o paradigma do Raciocínio Agente, onde LLMs são reformulados como agentes autônomos que planejam, agem e aprendem por meio da interação contínua com seu ambiente. Ele fornece um roteiro unificado que une pensamentos e ações, oferecendo orientações práticas para construir sistemas agentes em ambientes de dinâmica e otimização. O arcabouço organiza o raciocínio agentico ao longo de três dimensões complementares: 1. Raciocínio Agente Fundamental: Capacidades centrais de agente único, incluindo planejamento, uso de ferramentas e busca. Os agentes decompõem objetivos, invocam ferramentas externas e verificam resultados por meio de ações executáveis. Essa é a rocha-mãe. 2. Raciocínio Agential Autoevolutivo: Como os agentes melhoram por meio de feedback, memória e adaptação. Em vez de seguir caminhos de raciocínio fixos, os agentes desenvolvem mecanismos para reflexão, crítica e aprendizado orientado pela memória. Reflexão, RL para memória e adaptação contínua ligam raciocínio à aprendizagem. 3. Raciocínio Multiagente Coletivo: Escalar a inteligência de solucionadores isolados para ecossistemas colaborativos. Múltiplos agentes coordenam por meio da atribuição de papéis, protocolos de comunicação e memória compartilhada. Debate, resolução de discordâncias e consistência por meio de interações em múltiplos turnos. Em todas as camadas, a pesquisa distingue dois modos de otimização: raciocínio em contexto (escalar computação em tempo de inferência por meio de orquestração e busca sem atualizações de parâmetros) e raciocínio pós-treinamento (internalização de estratégias via RL e ajuste fino). A pesquisa abrange aplicações que abrangem exploração matemática, descoberta científica, robótica incorporada, saúde e pesquisa em web autônoma. Também revisa o cenário de referência para avaliar capacidades agenticas. Tenho observado de perto essa área de pesquisa, e aqui estão alguns dos desafios em aberto que permanecem: personalização, interação a longo prazo, modelagem de mundos, treinamento escalável de múltiplos agentes e frameworks de governança para implantação no mundo real. ...