Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Desde un proyecto paralelo apurado creado para resolver sus propios problemas de optimización de LLM hasta convertirse en el marcador independiente de facto de la industria, Micah Hill-Smith y George Cameron pasaron por el camino de lanzar el Análisis Artificial de forma gratuita, pagando de su bolsillo los costes de benchmarking y haciéndolo crecer hasta convertirlo en lo que muchos ahora llaman el "nuevo Gartner de la IA" para empresas, laboratorios y desarrolladores. Nos sentamos con Micah y George para analizar por qué el benchmarking verdaderamente independiente es tan difícil (varianza rápida, saturación de evaluaciones, políticas de comprador misterioso), cómo evolucionó el Índice de Inteligencia de Análisis Artificial a medida que se rompieron los antiguos benchmarks, y qué métricas nuevas realmente importan ahora, como las evaluaciones agenticas (GDPVal-AA). También profundizamos en la economía detrás de la "curva de la sonrisa" de la IA: por qué la inteligencia se está saliendo entre 100 y 1000× más barata por unidad mientras el gasto total se dispara, cómo el razonamiento y los agentes cambian la eficiencia de los tokens, y su apuesta de que las evaluaciones deben evolucionar continuamente o corren el riesgo de entrenar a la industria para optimizar para las cosas equivocadas. @swyx @_micah_h @grmcameron

Populares

Ranking

Favoritas