Jeg tok nettopp en grundig titt på MiroThinker 1.5, og deres agentkomprimeringsmetode er litt ond, men jeg forstår den og synes den er veldig nyttig.
Kjernen løser problemet med «hvordan plassere 400-verktøybruk i en 256K-kontekst».
De gjorde noe ekstremt dristig: fysisk maskerte Observasjonen (verktøyet returnerer resultatet) i tenk-handling-observasjon i ReActs historie.
Bortsett fra den nylige K-runden med å beholde originalteksten, har de tidligere hundrevis av verktøyresultater alle blitt erstattet med setningen «Verktøyresultat er utelatt for å lagre tokens». Men alle holdes <thought>intakte.
Det er en veldig motintuitiv del av dette, denne agenten selv gjør grundig research, så han beholder bare originalteksten fra siste K-runde, altså den femte runden, og det er ingen foran den, hvordan kan han svare på spørsmålet.
Dette har et svært obskurt, men avgjørende premiss: så lenge tanken er tett nok, nærmer den seg faktisk Sammendraget uendelig.
Hver tankegenerering er i hovedsak et utdrag av informasjon fra modellen for den nåværende observasjonen. Da T1 ble generert, var nøkkeldataene i O1 allerede «spist» inn i hjernen.
Mens O1 ble erstattet med en plassholder, forble T1. T1 blir O1s "informasjonskomprimeringspakke". Det er ikke nødvendig å legge til en ekstra oppsummeringsagent, denne komplette tankerekken er i seg selv en høyoppløselig «dynamisk oppsummering» som kontinuerlig oppdateres gradvis.
Om kontekstteknikk. Det er to spørsmål som jeg tror kan se på nivået på folk spesielt, og jeg spurte ham hvordan man designer read_file write_file under XX-forretningsscenariet. Hvis du virkelig bare leser og skriver spesifikke dokumenter, kan du avslutte her.
Antropisk er egentlig en kobling mellom teori og praksis
Når man sendte skills, ble to metoder foreslått: Prompt hierarkisk lasting/multipleksing, kodeutførelse og sammenkoblings-API/mcp (manus kaller denne kontekstoffloading).
For to dager siden fikset jeg disse to metodene til inferens-API-nivået, Tool Search Tool, som løser verktøyoppdagelse og lat innlasting, og Programmatic Tool Calling for å implementere kodeutførelsesverktøy. Jeg føler at Anthropic API-protokollen 😂 har stor mulighet til å erstatte OpenAI i fremtiden