Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Samowystarczalna struktura do odkrywania i doskonalenia umiejętności agentów. Większość umiejętności agentów, które widzę dzisiaj, jest ręcznie tworzona lub słabo zaprojektowana przez agenta. Systemy wieloagentowe do budowania umiejętności wyglądają obiecująco. Niniejszy artykuł wprowadza EvoSkill, samowystarczalną strukturę, która automatycznie odkrywa i doskonali umiejętności agentów poprzez iteracyjną analizę niepowodzeń. EvoSkill analizuje niepowodzenia wykonania, proponuje nowe umiejętności lub edytuje istniejące, a następnie materializuje je w uporządkowanych, wielokrotnego użytku folderach umiejętności. Trzech współpracujących agentów napędza cały proces. Wykonawca, który wykonuje zadania, Propozycjonista, który diagnozuje niepowodzenia, oraz Budowniczy Umiejętności, który tworzy konkretne foldery umiejętności. Granica Pareto rządzi selekcją, zatrzymując tylko te umiejętności, które poprawiają wydajność walidacji, jednocześnie utrzymując model podstawowy w stanie zamrożonym. Na OfficeQA, EvoSkill poprawia Claude Code z Opus 4.5 z 60,6% do 67,9% dokładności dokładnego dopasowania. Na SealQA przynosi 12,1% zysku. Umiejętności rozwinięte na SealQA przenoszą się zero-shot do BrowseComp, poprawiając dokładność o 5,3% bez modyfikacji. Będę nadal uważnie śledzić tę linię badań. Uważam, że to naprawdę ważne. Artykuł: Ucz się, jak budować skuteczne agenty AI w naszej akademii:

Najlepsze

Ranking

Ulubione