Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Pesquisa impressionante sobre raciocínio agential para LLMs.
(marca este)
135+ páginas!
Por que isso importa?
LLMs raciocinham bem em ambientes de mundo fechado, mas têm dificuldades em ambientes abertos e dinâmicos onde a informação evolui.
A peça que falta é a ação. Isso ocorre porque o raciocínio estático sem interação não pode se adaptar, aprender ou melhorar a partir do feedback.
Esta nova pesquisa sistematiza o paradigma do Raciocínio Agente, onde LLMs são reformulados como agentes autônomos que planejam, agem e aprendem por meio da interação contínua com seu ambiente.
Ele fornece um roteiro unificado que une pensamentos e ações, oferecendo orientações práticas para construir sistemas agentes em ambientes de dinâmica e otimização.
O arcabouço organiza o raciocínio agentico ao longo de três dimensões complementares:
1. Raciocínio Agente Fundamental: Capacidades centrais de agente único, incluindo planejamento, uso de ferramentas e busca. Os agentes decompõem objetivos, invocam ferramentas externas e verificam resultados por meio de ações executáveis. Essa é a rocha-mãe.
2. Raciocínio Agential Autoevolutivo: Como os agentes melhoram por meio de feedback, memória e adaptação. Em vez de seguir caminhos de raciocínio fixos, os agentes desenvolvem mecanismos para reflexão, crítica e aprendizado orientado pela memória. Reflexão, RL para memória e adaptação contínua ligam raciocínio à aprendizagem.
3. Raciocínio Multiagente Coletivo: Escalar a inteligência de solucionadores isolados para ecossistemas colaborativos. Múltiplos agentes coordenam por meio da atribuição de papéis, protocolos de comunicação e memória compartilhada. Debate, resolução de discordâncias e consistência por meio de interações em múltiplos turnos.
Em todas as camadas, a pesquisa distingue dois modos de otimização: raciocínio em contexto (escalar computação em tempo de inferência por meio de orquestração e busca sem atualizações de parâmetros) e raciocínio pós-treinamento (internalização de estratégias via RL e ajuste fino).
A pesquisa abrange aplicações que abrangem exploração matemática, descoberta científica, robótica incorporada, saúde e pesquisa em web autônoma. Também revisa o cenário de referência para avaliar capacidades agenticas.
Tenho observado de perto essa área de pesquisa, e aqui estão alguns dos desafios em aberto que permanecem: personalização, interação a longo prazo, modelagem de mundos, treinamento escalável de múltiplos agentes e frameworks de governança para implantação no mundo real.
...

Melhores
Classificação
Favoritos
