Чи може ШІ справді міркувати щодо ринків прогнозування — чи просто узгоджувати патерни на основі навчальних даних? Натхненні агентом @ahall_research (який здійснив +60% обміну, але також вважав, що вибори 2026 року «вже відбулися»), ми розробили план покращення AI-агентів Polymarket. Джерело: @0xfishylosopher
@ahall_research @0xfishylosopher Наш агент уже використовує консенсус з 3 моделей (GPT, Gemini, Claude), але нам бракує важливих функцій, які виявляють помилки в міркуванні до того, як вони стануть дорогими угодами. 5 функцій, з якими нам потрібна допомога спільноти, нижче.
@ahall_research @0xfishylosopher 1️⃣ Модель Дебатної Системи Замість того, щоб просто голосувати, моделі повинні кидати виклик одна одній. Коли Клод заявив: «Sleigh Ride ніколи не потрапляє в Топ-10», лише виклик іншої моделі змусив її визнати помилку і оновити.
@ahall_research @0xfishylosopher 2️⃣ Інтеграція настроїв новин Найкраща угода агента Kalshi була з аналізу новин документальних новин про Епштейна через GDELT. Наш агент не помічає актуальних подій — величезний розрив для політичних ринків.
@ahall_research @0xfishylosopher 3️⃣ Перевірки часового мислення LLM постійно плутають минуле і майбутнє. Нам потрібна чітка перевірка: «Чи вже відбулася ця подія?» перед кожною торгівлею.
@ahall_research @0xfishylosopher 4️⃣ Перевірка історичних фактів Моделі впевнено галюцинують про історію. Додайте шар перевірки, щоб виявити хибні твердження про «те, що зазвичай відбувається».
@ahall_research @0xfishylosopher Побудований з x402 мікроплатежами — агент оплачує власний ШІ. Без API-ключів — справжня автономна економіка. Автори хотіли, 🚀 щоб Вибрали функцію і випустили її. Давайте з'ясуємо, про що агенти ШІ насправді можуть міркувати.
1,06K