Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Trabajo de investigación impresionante.
🚨 Los LLM son terribles en los refutaciones. Este artículo muestra exactamente por qué.
La mayoría de las herramientas de IA tratan las refutaciones como una tarea de escritura. Generar texto educado. Sonar seguro. Pasar a otra cosa.
Esa es precisamente la razón por la que fallan en conferencias de primer nivel.
Esta investigación invierte todo el problema de la refutación.
En lugar de "generar una respuesta", trata las refutaciones como una tarea de decisión + organización de evidencia.
El sistema, llamado RebuttalAgent, es un pipeline de múltiples agentes que se niega a escribir nada hasta que la lógica sea impecable.
Primero, atomiza los comentarios de los revisores. Cada párrafo vago se descompone en preocupaciones precisas y accionables. No se pierden puntos. No se agrupan críticas no relacionadas. La cobertura se impone antes de que ocurra cualquier otra cosa.
A continuación viene la verdadera innovación: razonamiento basado en evidencia.
Para cada preocupación, el sistema construye un contexto híbrido. La mayor parte del artículo se mantiene comprimida para ahorrar tokens, pero las secciones exactas relevantes para ese comentario del revisor se expanden con total fidelidad. Si la evidencia interna no es suficiente, un agente de búsqueda bajo demanda recupera artículos externos y los convierte en resúmenes listos para citar. Nada se cita a menos que sea rastreable.
Luego viene el paso que la mayoría de las herramientas LLM omiten por completo: verificación de estrategia.
Antes de redactar, RebuttalAgent genera un plan de respuesta explícito. Separa:
Lo que se puede aclarar utilizando resultados existentes
Lo que realmente requiere nuevos experimentos
Lo que debe ser reconocido sin comprometerse demasiado
Un agente verificador audita este plan en busca de consistencia lógica y seguridad de compromiso. Si una respuesta implica resultados que no existen, se bloquea. Las alucinaciones mueren aquí....
Parte superior
Clasificación
Favoritos
