Imponerande översikt över agentiskt resonemang för LLM:er. (bokmärker den här) 135+ sidor! Varför spelar det någon roll? LLM:er resonerar bra i slutna världar, men de har svårt i öppna, dynamiska miljöer där information utvecklas. Den saknade pusselbiten är handling. Detta beror på att statiskt resonemang utan interaktion inte kan anpassa sig, lära sig eller förbättras genom feedback. Denna nya undersökning systematiserar paradigmet Agentic Reasoning, där LLM:er omdefinieras som autonoma agenter som planerar, agerar och lär sig genom kontinuerlig interaktion med sin omgivning. Den tillhandahåller en enhetlig färdplan som förenar tankar och handlingar, och ger handlingsbar vägledning för att bygga agentiska system över miljödynamik och optimeringsmiljöer. Ramverket organiserar agentiskt resonemang längs tre kompletterande dimensioner: 1. Grundläggande agentiskt resonemang: Kärnfunktioner för enskilda agenter inklusive planering, verktygsanvändning och sökning. Agenter dekomponerar mål, anropar externa verktyg och verifierar resultat genom exekverbara åtgärder. Det här är grunden. 2. Självutvecklande agentiskt resonemang: Hur agenter förbättras genom återkoppling, minne och anpassning. Istället för att följa fasta resonemangsvägar utvecklar agenter mekanismer för reflektion, kritik och minnesdrivet lärande. Reflexion, RL för minne och kontinuerlig anpassning kopplar resonemang till lärande. 3. Kollektivt multi-agent resonemang: Att skala intelligens från isolerade lösare till samarbetsinriktade ekosystem. Flera agenter samordnar genom rollfördelning, kommunikationsprotokoll och delat minne. Debatt, lösning av oenigheter och konsekvens genom interaktioner med flera turer. Över alla nivåer skiljer undersökningen två optimeringslägen: in-context resonemang (skalning av inferensberäkning genom orkestrering och sökning utan parameteruppdateringar) och post-träningsresonemang (internalisering av strategier via RL och finjustering). Undersökningen täcker tillämpningar som sträcker sig över matematikutforskning, vetenskapliga upptäckter, förkroppsligad robotik, hälsovård och autonom webbforskning. Den granskar också benchmark-landskapet för att utvärdera agentiska förmågor. Jag har studerat detta forskningsområde noggrant, och här är några av de öppna utmaningar som återstår: personalisering, långsiktig interaktion, världsmodellering, skalbar multiagentträning och styrningsramverk för verklig implementering. ...