Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Umělá inteligence je chybná už ze své podstaty.
Ne kvůli zlému úmyslu nebo něčemu jinému, ale protože modeluje realitu a realita je pravděpodobnostní. Pravda se stává čímkoliv, o čem rozhodnou váhy.
To je problém LLM, pouze předpovídají další token.
Sledováním lineárních vzorů pro dotazy odpovídá, rozpoznává a zrcadlí odpovědi, které se hodí.
Žádáte o tři položky; dává čtyři.
Proč tomu tak je?
Nastupuje parametrické zkreslení znalostí: silná trénovací data přepíší slabé dotazy a slučují zdroje, dokud model neuvěří své vlastní kompresi světa.
Už jste se někdy dotazovali umělé inteligence a dostali jste odpověď: "Nevím" To je vzácné nebo by se to pravděpodobně nikdy nestalo.
Protože na tento koncept zapomínají. Zdá se, že vědí všechno i v předmětu, který je mimo jejich doménu.
Umělá inteligence vyvíjí systém založený na principech neuromorfních výpočtů, který napodobuje fyzický mechanismus lidské paměti a pochybností.
Složité dotazy jsou obvykle obětí takových okolností – jsou vítány ohromujícími halucinacemi.
Proč?
>> Složená chyba v jejích krocích
>> Nedostatek struktury problému
>> Rozptýlení irelevantního kontextu
@SentientAGI má řešení - ROMA [Rekurzivní Open Meta Agent] → orchestrátoru.
Ve hře o úkoly s dlouhým horizontem záleží na struktuře více než na inteligenci.
ROMA to chápe, a proto přijímá rekurzivně-hierarchický řetězec příkazů, který udržuje tok kontextu.
Jak funguje ROMA - finální boss pro řešení úloh s dlouhým horizontem?
ROMA poskytuje agentům rekurzivní kostru – hierarchický strom úloh, který řídí tok kontextu.
Jakmile je kontextový tok přerušen, vplíží se anarchie.
Takže ROMA je vynucována, aby řídila tok kontextu.
Aby to bylo možné efektivně zvládnout, ROMA;
Odděluje a rozkládá úkoly na různé sub agenty známé jako uzly, zejména úkoly, které považuje za složité.
Říkejme ROMA manažerovi umělé inteligence, který spravuje ostatní umělé inteligence.
Na jednoduchém obrázku je zde struktura:
Nadřazené uzly: agenti na vysoké úrovni, kteří obdrží váš komplexní cíl.
=> Rozdělí to na podúkoly a předají je podřízeným uzlům (jednodušším agentům/nástrojům).
=> Podřízené uzly vyřeší svůj dílek, výsledky pošlou zpět nahoru do nadřazených uzlů.
=> Nadřazené uzly agregují řešení a kombinují je do konečného výsledku.
Dotaz vyřešen!
Čtyři typy uzlů, které řídí systém ROMA:
>> Atomizer – Determinant kývne. Zhodnoťte úkol. Určuje, zda jsou dostatečně jednoduché na provedení? Nebo potřebuje rozklad?
>> Planner – Pokud úkol potřebuje rozklad – rozdělí složité cíle na dílčí úkoly. Každá dílčí úloha se stane podřízeným uzlem. Úlohy mohou běžet postupně (pokud jsou závislé) nebo paralelně (pokud jsou nezávislé).
>> Executor – Provede práci. Volá nástroje, agenty, API. Podle potřeby předává výstupy nahoru nebo dolů ve stromu.
>> Aggregator – Sbírá výsledky z podřízených uzlů, ověřuje konzistenci, syntetizuje konečnou odpověď.
Zde je obsáhlý obrázek 👇
Dotaz: "Kolik filmů s rozpočtem 350 milionů dolarů+ nebylo nejvýdělečnějších v roce vydání?"
Proces ROMA:
1/ Kontroly atomizéru - uzel Determinant. Příliš složité pro jeden krok? Přichází na řadu atomizér.
2/ Plánovač. Cíl je příliš složitý? Přijde plánovač, rozloží se:
Dílčí úkol 1: Najít všechny filmy za 350 milionů $ + (názvy, rozpočty, roky)
Dílčí úkol 2: Najděte nejvýdělečnější filmy za rok
Dílčí úkol 3: Křížové odkazy a filtr
3/ Exekutoři spouštějí jednotlivé subtasky (vyhledávací API, extrakční modely)
4/ Agregátor syntetizuje: čistý seznam filmů odpovídajících kritériím.
Kromě vzorců rekurzivní smyčky v ROMA přidala další vrstvu přehlednosti pro SSSR & Builders.
Člověk-in-the-loop = zásah uživatele.
Inherentní funkce mechanismu zpětné vazby, která umožňuje uživatelům bez oprávnění dát mat podmínce jejich dotazu. K tomu dochází hned po fázi plánování.
"Zjistil jsem tato fakta. Mají pravdu? Naplánoval jsem tyto substacky - jsou v souladu s tím, co chcete?" To umožňuje uživateli opravovat, upravovat nebo přidávat kontexty před tím, než agent pokračuje.

Sledování scény - pro stavitele
Pro vývojáře, který vytváří nebo ladí agenta. Sledování jeviště odhaluje vnitřní uvažování:
>> Jaký vstup tento uzel obdržel?
>> Jaký výstup vyprodukoval?
>> Kde se kontext ztratil nebo zkreslil?
Tvůrce používá tuto průhlednost k následujícím účelům:
>> Diagnostikujte místa, kde dochází k selhání.
>> upřesnění výzev v konkrétních uzlech
>> Vyměňte nedostatečně výkonné agenty/nástroje.
Tato funkce pomáhá uživatelům zachytit chyby v reálném čase a stavitelům opravit systematické problémy na architektonické úrovni.
Využití v reálném světě
Vyhledávání ROMA jako důkaz konceptu využívající celou architekturu ROMA s SEAL-0, testem komplexního benchmarku vícezdrojového uvažování s přesností 45,6 % (nejmodernější), předchozí nejlepší (Kimi Researcher): 36 %, Gemini 2.5 Pro: 19,8 %, nejlepší open-source soupeř: 8,9 %.
1,93K
Top
Hodnocení
Oblíbené

