Indrukwekkende enquête over agentisch redeneren voor LLM's. (boekmark deze) 135+ pagina's! Waarom is het belangrijk? LLM's redeneren goed in gesloten wereldinstellingen, maar ze hebben moeite in open-ended, dynamische omgevingen waar informatie evolueert. Het ontbrekende stuk is actie. Dit komt omdat statisch redeneren zonder interactie niet kan aanpassen, leren of verbeteren op basis van feedback. Deze nieuwe enquête systematiseert het paradigma van Agentisch Redeneren, waarbij LLM's worden herschreven als autonome agenten die plannen, handelen en leren door voortdurende interactie met hun omgeving. Het biedt een verenigde routekaart die gedachten en acties verbindt, en biedt uitvoerbare richtlijnen voor het bouwen van agentische systemen over milieudynamiek en optimalisatie-instellingen. Het kader organiseert agentisch redeneren langs drie complementaire dimensies: 1. Fundamenteel Agentisch Redeneren: Kern capaciteiten van een enkele agent, waaronder planning, gereedschapsgebruik en zoeken. Agenten decomponeren doelen, roepen externe tools aan en verifiëren resultaten door uitvoerbare acties. Dit is de basis. 2. Zelf-Evoluerend Agentisch Redeneren: Hoe agenten verbeteren door feedback, geheugen en aanpassing. In plaats van vaste redeneringspaden te volgen, ontwikkelen agenten mechanismen voor reflectie, kritiek en geheugen-gedreven leren. Reflectie, RL-voor-geheugen en voortdurende aanpassing koppelen redeneren aan leren. 3. Collectief Multi-Agent Redeneren: Schalen van intelligentie van geïsoleerde oplossers naar samenwerkende ecosystemen. Meerdere agenten coördineren via roltoewijzing, communicatieprotocollen en gedeeld geheugen. Debat, geschiloplossing en consistentie door multi-turn interacties. Over alle lagen heen, onderscheidt de enquête twee optimalisatiemodi: in-context redeneren (schaal inferentietijd berekeningen door orkestratie en zoeken zonder parameterupdates) en post-training redeneren (internaliseren van strategieën via RL en fine-tuning). De enquête behandelt toepassingen die zich uitstrekken over wiskunde-exploratie, wetenschappelijke ontdekking, belichaamde robotica, gezondheidszorg en autonome webonderzoek. Het beoordeelt ook het benchmarklandschap voor het evalueren van agentische capaciteiten. Ik heb deze onderzoeksgebied nauwlettend gevolgd, en hier zijn enkele van de openstaande uitdagingen die blijven bestaan: personalisatie, lange-horizon interactie, wereldmodellering, schaalbare multi-agent training en governancekaders voor implementatie in de echte wereld. ...