Dokáže AI skutečně uvažovat o predikčních trzích – nebo jen o vzorech na trénovacích datech? Inspirováni agentem @ahall_research (který udělal +60 % obchodů, ale také si myslel, že volby v roce 2026 "už proběhly"), jsme naplánovali, jak zlepšit AI agenta Polymarketu. Zdroj: @0xfishylosopher
@ahall_research @0xfishylosopher Náš agent už používá konsenzus 3-modelů (GPT, Gemini, Claude), ale chybí nám klíčové funkce, které by zachytily chyby v uvažování dříve, než se stanou nákladnými obchody. Níže je 5 funkcí, se kterými potřebujeme pomoc od komunity.
@ahall_research @0xfishylosopher 1️⃣ Modelový debatní systém Místo pouhého hlasování by se modelky měly navzájem vyzývat. Když Claude prohlásil: "Jízda na saních nikdy nevstupuje do Top 10," jen výzva jiného modelu ho přiměla přiznat chybu a aktualizovat.
@ahall_research @0xfishylosopher 2️⃣ Integrace sentimentu ve zprávách Nejlepší obchod agenta Kalshi přišel z analýzy zpráv o Epsteinovi přes GDELT. Náš agent je slepý k aktuálnímu dění – obrovská mezera pro politické trhy.
@ahall_research @0xfishylosopher 3️⃣ Kontroly časového uvažování LLM neustále pletou minulost a budoucnost. Před každým obchodem potřebujeme jasné ověření: "Stala se tato událost již skutečností?"
@ahall_research @0xfishylosopher 4️⃣ Ověřování historických faktů Modelky sebevědomě halucinují o historii. Přidejte ověřovací vrstvu, která odhalí falešná tvrzení o "co se obvykle děje".
@ahall_research @0xfishylosopher Postaveno na x402 mikroplatbách – agent platí za svou vlastní AI. Žádné API klíče, skutečná autonomní ekonomika. Přispěvatelé chtěli, 🚀 aby si vybrali funkci a poslali ji. Pojďme zjistit, o čem AI agenti vlastně dokážou uvažovat.
1,05K