Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Artigo de pesquisa incrível.
🚨 Os LLMs são terríveis em refutações. Este artigo mostra exatamente porquê.
A maioria das ferramentas de IA trata as refutações como uma tarefa de escrita. Gerar texto educado. Soar confiante. Seguir em frente.
É precisamente por isso que falham em conferências de alto nível.
Esta pesquisa inverte todo o problema da refutação.
Em vez de "gerar uma resposta", trata as refutações como uma tarefa de decisão + organização de evidências.
O sistema, chamado RebuttalAgent, é um pipeline multi-agente que se recusa a escrever qualquer coisa até que a lógica esteja à prova de falhas.
Primeiro, ele atomiza o feedback dos revisores. Cada parágrafo vago é dividido em preocupações precisas e acionáveis. Nenhum ponto é perdido. Nenhuma crítica não relacionada é agrupada. A cobertura é imposta antes que qualquer outra coisa aconteça.
Em seguida, vem a verdadeira inovação: raciocínio baseado em evidências.
Para cada preocupação, o sistema constrói um contexto híbrido. A maior parte do artigo permanece comprimida para economizar tokens, mas as seções exatas relevantes para aquele comentário do revisor são expandidas em plena fidelidade. Se as evidências internas não forem suficientes, um agente de busca sob demanda recupera artigos externos e os converte em resumos prontos para citação. Nada é citado a menos que seja rastreável.
Então vem a etapa que a maioria das ferramentas LLM ignora completamente: verificação de estratégia.
Antes de redigir, o RebuttalAgent gera um plano de resposta explícito. Ele separa:
O que pode ser esclarecido usando resultados existentes
O que realmente requer novos experimentos
O que deve ser reconhecido sem se comprometer excessivamente
Um agente verificador audita este plano em busca de consistência lógica e segurança de compromisso. Se uma resposta implica resultados que não existem, ela é bloqueada. Alucinações morrem aqui....
Top
Classificação
Favoritos
