DApp Store | Web3 Hub for hendelser og spill | OKX Wallet

Populære emner

#

Bonk Eco continues to show strength amid $USELESS rally

Hosico−4,45 %

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN−6,18 %

#

Boop.Fun leading the way with a new launchpad on Solana.

header

yan5xu

🤖 AI-nybegynner

yan5xu

yan5xu13. jan., 16:01

Jeg tok nettopp en grundig titt på MiroThinker 1.5, og deres agentkomprimeringsmetode er litt ond, men jeg forstår den og synes den er veldig nyttig. Kjernen løser problemet med «hvordan plassere 400-verktøybruk i en 256K-kontekst». De gjorde noe ekstremt dristig: fysisk maskerte Observasjonen (verktøyet returnerer resultatet) i tenk-handling-observasjon i ReActs historie. Bortsett fra den nylige K-runden med å beholde originalteksten, har de tidligere hundrevis av verktøyresultater alle blitt erstattet med setningen «Verktøyresultat er utelatt for å lagre tokens». Men alle holdes <thought>intakte. Det er en veldig motintuitiv del av dette, denne agenten selv gjør grundig research, så han beholder bare originalteksten fra siste K-runde, altså den femte runden, og det er ingen foran den, hvordan kan han svare på spørsmålet. Dette har et svært obskurt, men avgjørende premiss: så lenge tanken er tett nok, nærmer den seg faktisk Sammendraget uendelig. Hver tankegenerering er i hovedsak et utdrag av informasjon fra modellen for den nåværende observasjonen. Da T1 ble generert, var nøkkeldataene i O1 allerede «spist» inn i hjernen. Mens O1 ble erstattet med en plassholder, forble T1. T1 blir O1s "informasjonskomprimeringspakke". Det er ikke nødvendig å legge til en ekstra oppsummeringsagent, denne komplette tankerekken er i seg selv en høyoppløselig «dynamisk oppsummering» som kontinuerlig oppdateres gradvis.

74

yan5xu

yan5xu3. jan., 18:12

Om kontekstteknikk. Det er to spørsmål som jeg tror kan se på nivået på folk spesielt, og jeg spurte ham hvordan man designer read_file write_file under XX-forretningsscenariet. Hvis du virkelig bare leser og skriver spesifikke dokumenter, kan du avslutte her.

157

yan5xu

yan5xu26. nov. 2025

Antropisk er egentlig en kobling mellom teori og praksis Når man sendte skills, ble to metoder foreslått: Prompt hierarkisk lasting/multipleksing, kodeutførelse og sammenkoblings-API/mcp (manus kaller denne kontekstoffloading). For to dager siden fikset jeg disse to metodene til inferens-API-nivået, Tool Search Tool, som løser verktøyoppdagelse og lat innlasting, og Programmatic Tool Calling for å implementere kodeutførelsesverktøy. Jeg føler at Anthropic API-protokollen 😂 har stor mulighet til å erstatte OpenAI i fremtiden

336

Topp

Rangering

Favoritter

©2017 - 2026 WEB3.OKX.COM

Norsk (bokmål)简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Suomi Svenska Türkçe

More about OKX Wallet

Last ned Lær Om oss Karrierer Kontakt oss Vilkår for bruk Personvernerklæring X (tidligere Twitter)

Product

Tokens Swap Marketplace Earn Discover Build Utforsker Sikkerhet

Støtte

Supportsenter Verifisering av kanal Kunngjøringer DEX-gebyrplan Bli kjent med OKX Bitcoin-lommebok Ethereum-lommebok Solana-lommebok