Výzkumná práce o skvělých věcech. 🚨 LLM jsou hrozní v protiargumentech. Tento článek přesně ukazuje proč. Většina AI nástrojů bere odpovědi jako psaní úkolu. Vytvořte zdvořilý text. Zníš sebevědomě. Jdi dál. Právě proto selhávají na špičkových konferencích. Tento výzkum obrací celý problém s vyvrácením naruby. Místo "generování odpovědi" považuje protiargumenty za úkol organizace rozhodnutí + důkazů. Systém nazvaný RebuttalAgent je víceagentní pipeline, která odmítá cokoli napsat, dokud není logika neprobojná. Za prvé, rozděluje zpětnou vazbu recenzentů. Každý vágní odstavec je rozdělen na přesné, konkrétní otázky. Žádné body nebyly ztraceny. Žádné nesouvisející kritiky se nespojují dohromady. Krytí je vynucováno dřív, než se stane cokoli jiného. Následuje skutečná inovace: uvažování založené na důkazech. Pro každou otázku systém vytváří hybridní kontext. Většina článku zůstává komprimovaná pro úsporu tokenů, ale přesné části relevantní k komentáři recenzenta jsou plně rozpracované. Pokud interní důkazy nestačí, agent pro vyhledávání na vyžádání získá externí dokumenty a převede je na podklady připravené k citaci. Nic není pokutováno, pokud to není dohledatelné. Pak přichází krok, který většina LLM nástrojů úplně přeskakuje: ověřování strategie. Před vypracováním RebuttalAgent vytvoří explicitní plán reakce. Rozděluje: Co lze objasnit na základě stávajících výsledků Co skutečně vyžaduje nové experimenty Co by mělo být uznáno, aniž by se člověk příliš zavázal Kontrolní agent tento plán audituje z hlediska logické konzistence a bezpečnosti závazků. Pokud odpověď naznačuje výsledky, které neexistují, je zablokována. Halucinace tady umírají....