Desde un proyecto paralelo apurado creado para resolver sus propios problemas de optimización de LLM hasta convertirse en el marcador independiente de facto de la industria, Micah Hill-Smith y George Cameron pasaron por el camino de lanzar el Análisis Artificial de forma gratuita, pagando de su bolsillo los costes de benchmarking y haciéndolo crecer hasta convertirlo en lo que muchos ahora llaman el "nuevo Gartner de la IA" para empresas, laboratorios y desarrolladores. Nos sentamos con Micah y George para analizar por qué el benchmarking verdaderamente independiente es tan difícil (varianza rápida, saturación de evaluaciones, políticas de comprador misterioso), cómo evolucionó el Índice de Inteligencia de Análisis Artificial a medida que se rompieron los antiguos benchmarks, y qué métricas nuevas realmente importan ahora, como las evaluaciones agenticas (GDPVal-AA). También profundizamos en la economía detrás de la "curva de la sonrisa" de la IA: por qué la inteligencia se está saliendo entre 100 y 1000× más barata por unidad mientras el gasto total se dispara, cómo el razonamiento y los agentes cambian la eficiencia de los tokens, y su apuesta de que las evaluaciones deben evolucionar continuamente o corren el riesgo de entrenar a la industria para optimizar para las cosas equivocadas. @swyx @_micah_h @grmcameron