Czy systemy wieloagentowe (Multi-agent systems) często zawodzą? Problem może nie leżeć w samych agentach, ale w sposobie ich organizacji. Większość systemów przyjmuje stałe struktury łańcuchowe, drzewiaste lub grafowe, które nie mogą dostosować się do zmieniających się zadań. Ale co jeśli system mógłby uczyć się własnych wzorców współpracy? Ten przełomowy artykuł przedstawia ramy o nazwie Puppeteer, które mogą dynamicznie organizować agentów, zamiast polegać na wcześniej zaprojektowanej strukturze topologicznej. Kluczowe jest to, że: • Nie definiuje się już z góry struktury współpracy, lecz koordynator wybiera kolejnego agenta do wypowiedzi na podstawie zmieniającego się stanu rozmowy. • Używa się algorytmu REINFORCE do trenowania strategii, bezpośrednio optymalizując wskaźnik sukcesu zadania. • Wszystko jest serializowane jako ciągłe wybory agentów, zamiast przeszukiwać złożoną topologię grafu, co pozwala uniknąć złożoności kombinatorycznej. Wyniki są zaskakujące: Naturalnie formują się zwarte wzorce cykliczne, a nie ogromne struktury grafowe, w których 2-3 agentów wykonuje większość pracy. Co więcej, system potrafi samodzielnie odkrywać efektywność. Prezentacja wyników: • W przypadku problemów matematycznych GSM-Hard: dokładność osiągnęła 70% (w porównaniu do 13,5% przy użyciu samego modelu podstawowego). • W MMLU-Pro: osiągnięto 83% (bazowy wynik to 76%). • W SRDD przy rozwoju oprogramowania: osiągnięto 76,4% (bazowy wynik to 60,6%). Te poprawy towarzyszyły zmniejszeniu zużycia tokenów. Artykuł pokazuje, że w całym procesie treningowym koszty tokenów stale malały, podczas gdy wydajność rosła. Udowodnili również, że proces wyboru agentów spełnia właściwości Markowa, co oznacza, że obecny stan może określić optymalnego następnego agenta, bez potrzeby śledzenia pełnej historii. Więc: Dla deweloperów AI, prostota, której się uczą, przewyższa starannie zaprojektowaną złożoność. Wytrenowany router, w połączeniu z kilkoma wyspecjalizowanymi agentami, może przewyższyć starannie zaprojektowane przepływy pracy, jednocześnie zmniejszając koszty obliczeniowe.
Link do pracy:
1,7K