Foco Cruncher #4 – Desafío de rotura estructural del laboratorio ADIA Hoy destacamos a Julian Mukaj, analista cuantitativo en M&G Investments, por su solución de mayor rendimiento en el Desafío de Ruptura Estructural ADIA Lab 2025 de 100.000 dólares organizado en Crunch.
La tarea: verificación de roturas estructurales. Dada una serie temporal y un punto de cambio propuesto, predecir la probabilidad (0–1) de que se produjera una verdadera ruptura estructural allí, un problema con aplicaciones en finanzas, clima, sanidad, macroeconomía y más.
En el centro del enfoque está la diversidad de características: Julian construye familias de características que comparan los segmentos previos y posteriores a la pausa: - distribuciones y estacionariedad - Estructura de volatilidad y varianza - compresión y complejidad - contenido espectral - geometría de caminos y extremos
Pruebas estadísticas y características de la teoría de la información Herramientas clásicas como ADF, KS, Cramér–von Mises, divergencias y entropías cuantifican los desplazamientos de distribución y estacionariedad a través del límite. Estas capturan la señal más directa: "¿Cambió la ley subyacente del movimiento?"
Transformaciones de varianza y volatilidad En los retornos normalizados z, él superpone: - Volatilidad de EWMA - desviaciones estándar en movimiento - residuos estandarizados (tamaño del choque frente a σ local) - Ventanas de variación estilo MOSUM Las características siguen el coeficiente de variación, la suavidad, la agrupación de volatilidad y la estructura de varianza dependiente del régimen alrededor de la ruptura candidata.
Geometría de compresión y CuSum - Las características basadas en Lempel–Ziv y zlib miden cuán compresible o estructurada es la secuencia antes y después de la escisión. - Las características basadas en CuSum (forma del codo, nitidez, distancias de Wasserstein sobre los residuos) resaltan desplazamientos de nivel medio y "codos" locales en la frontera. Juntos, revelan cambios sutiles en la complejidad y la dinámica media.
Características espectrales, SSA, ROCKET y trayectoria - Las características espectrales y SSA rastrean cómo la potencia se redistribuye entre frecuencias y cómo cambian los modos dominantes. - Las transformadas deterministas ROCKET actúan como características convolucionales ligeras para captar microestructuras no capturadas por estadísticas de bajo orden. - Las características de trayectorias y extremos (descensos, distancias a picos/valles) resumen la geometría del camino dependiente del régimen.
Uno de los hallazgos más llamativos: una "característica mágica" – el coeficiente global de variación. Por sí sola, ofrecía un impulso significativo de AUC y, lo que es más importante, actuaba como una puerta: pequeños intervalos de esta característica definen regímenes de datos distintos con frecuencias de interrupción muy distintas.
El análisis de dependencia parcial y ICE mostró que el modelo solo utiliza esta característica cerca de umbrales estrechos. Cruzar esos umbrales encamina las muestras hacia diferentes hojas donde otras características importan, particionando efectivamente el conjunto de datos en regímenes (incluyendo una banda de "negativos fáciles" con una tasa de positividad muy baja). Esta interacción se tradujo en una ganancia significativa de la AUC global.
Julian también exploró varias arquitecturas de aprendizaje profundo: - Modelos siameses / de incrustación para segmentos pre/post - CNN centradas en ventanas límite - Variantes híbridas LSTM–GARCH - Cabezas personalizadas que mezclan estadísticas globales, ventanas de límite y incrustaciones pre/post La mayoría se estancó alrededor del 65–75% de AUC a pesar de un ajuste considerable.
¿Por qué ganaron los árboles aquí? Los conjuntos de árboles podían explotar señales muy locales y de baja dimensión, como los estrechos umbrales CV, mientras que los modelos profundos tendían a suavizarlas mediante la normalización y el aprendizaje de representaciones. Dado el calendario de la competencia, la ingeniería de características + GBDT ofrecía el mejor equilibrio entre complejidad, interpretabilidad y rendimiento.
Un enorme agradecimiento a Julian Mukaj por compartir un desglose tan detallado de su enfoque, y a ADIA Lab y a todos los participantes en Crunchers por llevar al límite la detección de rupturas estructurales. Próximamente habrá más reportajes de Cruncher.
3.72K