Destacado de Cruncher #4 – Desafío de Ruptura Estructural del ADIA Lab Hoy destacamos a Julian Mukaj, Analista Cuantitativo en M&G Investments, por su solución de mejor rendimiento en el Desafío de Ruptura Estructural del ADIA Lab 2025 de $100K, organizado en Crunch.
La tarea: verificación de rupturas estructurales. Dada una serie temporal y un punto de cambio propuesto, predice la probabilidad (0–1) de que allí ocurrió una verdadera ruptura estructural, un problema con aplicaciones en finanzas, clima, salud, macroeconomía y más.
En el corazón del enfoque está la diversidad de características: Julian construye familias de características que comparan segmentos pre y post ruptura en: - distribuciones y estacionariedad - estructura de volatilidad y varianza - compresión y complejidad - contenido espectral - geometría de trayectorias y extremos
Pruebas estadísticas y características de la teoría de la información Herramientas clásicas como ADF, KS, Cramér–von Mises, divergencias y entropías cuantifican los cambios en la distribución y la estacionariedad a través de la frontera. Estos capturan la señal más directa: "¿Cambió la ley de movimiento subyacente?"
Transformaciones de varianza y volatilidad Sobre los rendimientos z-normalizados, él superpone: - volatilidad EWMA - desviaciones estándar móviles - residuos estandarizados (tamaño del shock vs σ local) - ventanas de varianza al estilo MOSUM Las características rastrean el coeficiente de variación, suavidad, agrupamiento de volatilidad y estructura de varianza dependiente del régimen alrededor de la ruptura candidata.
Compresión y geometría CuSum - Las características basadas en Lempel–Ziv y zlib miden cuán comprimible / estructurada está la secuencia antes y después de la división. - Las características basadas en CuSum (forma de codo, agudeza, distancias de Wasserstein en los residuos) destacan los cambios en el nivel medio y los "codos" locales en el límite. Juntas, revelan cambios sutiles en la complejidad y la dinámica media.
Características espectrales, SSA, ROCKET y de trayectoria - Las características espectrales y SSA rastrean cómo se redistribuye la potencia a través de las frecuencias y cómo cambian los modos dominantes. - Las transformaciones determinísticas ROCKET actúan como características convolucionales ligeras para captar microestructuras que no son capturadas por estadísticas de bajo orden. - Las características de trayectoria y extremos (caídas, distancias a picos/valleys) resumen la geometría de trayectoria dependiente del régimen.
Uno de los hallazgos más sorprendentes: una "característica mágica" – el coeficiente de variación global. Por sí solo, ofreció un aumento significativo en el AUC y, lo que es más importante, actuó como una puerta: pequeños intervalos de esta característica definen regímenes de datos distintos con frecuencias de ruptura muy diferentes.
El análisis de dependencia parcial e ICE mostró que el modelo solo utiliza esta característica cerca de umbrales estrechos. Cruzar esos umbrales dirige las muestras a diferentes hojas donde otras características son importantes, dividiendo efectivamente el conjunto de datos en regímenes (incluyendo una banda de "falsos negativos fáciles" con una tasa positiva muy baja). Esta interacción se tradujo en una ganancia significativa en el AUC general.
Julian también exploró varias arquitecturas de aprendizaje profundo: - Modelos Siamese / de incrustación para segmentos previos/posteriores - CNNs centradas en ventanas de límite - Variantes híbridas LSTM–GARCH - Cabezas personalizadas que mezclan estadísticas globales, ventanas de límite e incrustaciones previas/posteriores La mayoría se estabilizó alrededor del 65–75% de AUC a pesar de un ajuste sustancial.
¿Por qué ganaron los árboles aquí? Los conjuntos de árboles podrían explotar señales muy locales y de baja dimensión, como los estrechos umbrales de CV, mientras que los modelos profundos tendían a suavizarlos a través de la normalización y el aprendizaje de representaciones. Dada la línea de tiempo de la competencia, la ingeniería de características + GBDTs ofreció el mejor equilibrio entre complejidad, interpretabilidad y rendimiento.
Un gran agradecimiento a Julian Mukaj por compartir un desglose tan detallado de su enfoque, y a ADIA Lab y a todos los Crunchers participantes por llevar la detección de rupturas estructurales a nuevos niveles. Pronto vendrán más destacados de Crunchers.
3,72K