Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Daniel Kang
Profesor asistente en UIUC CS. Anteriormente en el laboratorio DAWN de Stanford y en el Berkeley Sky Lab.
SWE-bench Verified es el estándar de oro para evaluar agentes de codificación: 500 problemas del mundo real + pruebas de OpenAI. ¿Suena a prueba de balas? No del todo.
Demostramos que pasar sus pruebas unitarias != coincidir con la verdad de referencia. En nuestro artículo de ACL, corregimos evaluaciones con errores: ¡el 24% de los agentes subieron o bajaron en la tabla de clasificación!
1/7

24,85K
El aprendizaje por refuerzo permite a los LLMs superar a los humanos en competiciones de programación/matemáticas y ha impulsado avances recientes (la serie o de OpenAI, Claude 4 de Anthropic)
¿Permitirá el RL una generalización amplia de la misma manera que lo hace el preentrenamiento? No con las técnicas actuales
🧵 1/7
2,57K
Estaré presentando en la sesión de pósters 2 en SIGMOD (miércoles a las 16:00 en Potsdam II). ¡Ven a saludarme!

Daniel Kang24 jun 2025
El procesamiento de consultas aproximadas (AQP) puede acelerar consultas analíticas de larga duración en órdenes de magnitud. Pero, ¿por qué sigue siendo raro el AQP en producción?
Para abordar esto, desarrollamos PilotDB, un middleware AQP en línea que no realiza cambios en los DBMS, entrega resultados con garantías de error a priori y logra hasta 126 veces más velocidad.
1/8
626
El procesamiento de consultas aproximadas (AQP) puede acelerar consultas analíticas de larga duración en órdenes de magnitud. Pero, ¿por qué sigue siendo raro el AQP en producción?
Para abordar esto, desarrollamos PilotDB, un middleware AQP en línea que no realiza cambios en los DBMS, entrega resultados con garantías de error a priori y logra hasta 126 veces más velocidad.
1/8
1,5K
@ZhanQiusi1 presentaremos nuestro trabajo en la sesión de pósteres del miércoles a las 11 a.m. y en el taller de TrustNLP del sábado (charla destacada)! Salúdala si la ves

Daniel Kang13 mar 2025
Los agentes de IA son cada vez más populares (por ejemplo, el operador de OpenAI), pero pueden ser atacados para dañar a los usuarios.
Demostramos que, incluso con defensas, los agentes de IA aún pueden verse comprometidos a través de inyecciones indirectas a través de "ataques adaptativos" en nuestro documento de hallazgos de NAACL 2025
🧵 y enlaces a continuación

99
Los ingenieros de datos dedican más del 60% de su tiempo a las canalizaciones de datos. ¿Pueden ayudar los agentes de IA?
Presentamos ELT-Bench, el primer punto de referencia que evalúa a los agentes de IA en la construcción de tuberías ELT de extremo a extremo. Los agentes actuales de SOTA solo logran una tasa de éxito del 3.9%, ¡hay un gran camino por recorrer!
1/7

3,98K
Daniel Kang republicó
Hoy en día, la IA puede generar toneladas de código, pero ¿cómo sabemos si es bueno?
Es por eso que creamos Sculptor: el primer entorno de agente de codificación.
Sculptor te ayuda a detectar problemas, escribir pruebas y mejorar tu código, todo mientras trabajas en tu editor favorito.
99,42K
Los agentes de IA son cada vez más populares (por ejemplo, el operador de OpenAI), pero pueden ser atacados para dañar a los usuarios.
Demostramos que, incluso con defensas, los agentes de IA aún pueden verse comprometidos a través de inyecciones indirectas a través de "ataques adaptativos" en nuestro documento de hallazgos de NAACL 2025
🧵 y enlaces a continuación

4,15K
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado