Banger araştırma makalesi. 🚨 LLM'ler yanıt vermekte çok kötü. Bu makale tam olarak nedenini gösteriyor. Çoğu yapay zeka aracı yanıtları yazı işi gibi ele alır. Nazik bir metin oluşturun. Kendine güvenmiş gibi görünüyorsun. Devam et. İşte bu yüzden üst düzey konferanslarda başarısız oluyorlar. Bu araştırma, tüm itiraz sorununu alt üst ediyor. "Yanıt oluşturmak" yerine, çürütmeleri karar + kanıt organizasyonu görevi olarak ele alıyor. RebuttalAgent olarak adlandırılan sistem, mantık hava geçirmez olana kadar hiçbir şey yazmayı reddeden çok ajanlı bir boru hattıdır. İlk olarak, incelemeci geri bildirimlerini atomize eder. Her belirsiz paragraf kesin, uygulanabilir endişelere ayrılır. Hiçbir puan kaçırılmadı. Alakasız eleştirileri bir araya getirmek. Kapsam, başka bir şey olmadan önce uygulanır. Sonra gerçek yenilik geliyor: kanıt öncelikli akıl yürütme. Her endişe için sistem hibrit bir bağlam oluşturur. Makalenin çoğu jetonları korumak için sıkıştırılmış kalıyor, ancak o inceleme yorumuyla ilgili tam bölümler tam özetle genişletilmiş. İç kanıtlar yeterli değilse, talep üzerine arama ajansı harici makaleleri bulup bunları atıf hazır brieflere dönüştürür. İzlenebilir olmadıkça hiçbir şey atıfta gösterilmez. Sonra çoğu LLM aracının tamamen atladığı bir adım geliyor: strateji doğrulama. Taslak oluşturmadan önce, RebuttalAgent açık bir yanıt planı oluşturur. Ayrılır: Mevcut sonuçlarla neler netleştirilebilir Gerçekten yeni deneyler gerektiren şeyler Aşırı taahhüt edilmeden ne kabul edilmeli Bir kontrolcü temsilci, bu planı mantıklı tutarlılık ve bağlılık güvenliği açısından denetler. Bir yanıt var olmayan sonuçları ima ederse, engellenir. Burada halüsinasyonlar ölür....