Destaque Cruncher #4 – Desafio de Quebra Estrutural do Laboratório ADIA Hoje destacamos Julian Mukaj, Analista Quantitativo da M&G Investments, por sua solução de melhor desempenho no Desafio de Quebra Estrutural ADIA Lab 2025 de $100 mil realizado no Crunch.
A tarefa: verificação de quebra estrutural. Dada uma série temporal e um ponto de mudança proposto, preveja-se a probabilidade (0–1) de que uma verdadeira ruptura estrutural tenha ocorrido ali – um problema com aplicações em finanças, clima, saúde, macroeconomia e mais.
No cerne da abordagem está a diversidade de recursos: Julian constrói famílias de recursos que comparam segmentos pré e pós-intervalo ao longo de: - distribuições e estacionariedade - Estrutura de volatilidade e variância - compressão e complexidade - conteúdo espectral - Geometria de Caminhos e Extremos
Testes estatísticos e características informacionais Ferramentas clássicas como ADF, KS, Cramér–von Mises, divergências e entropias quantificam os deslocamentos de distribuição e estacionariedade ao longo da fronteira. Esses capturam o sinal mais direto: "A lei do movimento subjacente mudou?"
Transformações de variância e volatilidade Nas devoluções normalizadas z, ele sobrepõe: - Volatilidade EWMA - desvios padrão rolantes - resíduos padronizados (tamanho do choque vs σ local) - Janelas de variação no estilo MOSUM As características acompanham coeficientes de variação, suavidade, agrupamento de volatilidade e estrutura de variância dependente do regime ao redor da quebra candidata.
Geometria de compressão e CuSum - Características baseadas em Lempel–Ziv e zlib medem quão compressível/estruturada a sequência é antes versus depois da divisão. - Características baseadas em CuSum (formato do cotovelo, nitidão, distâncias de Wasserstein nos resíduos) destacam deslocamentos de nível médio e "cotovelos" locais na fronteira. Juntos, eles revelam mudanças sutis na complexidade e na dinâmica média.
Características espectrais, SSA, ROCKET e path - As funcionalidades espectrais e SSA acompanham como a potência se redistribui entre frequências e como os modos dominantes mudam. - Transformadas determinísticas ROCKET atuam como características convolucionais leves para captar microestruturas não capturadas por estatísticas de ordem baixa. - As características de caminho e extremos (drawdowns, distâncias até picos/valles) resumem a geometria do caminho dependente do regime.
Uma das descobertas mais marcantes: uma "característica mágica" – o coeficiente global de variação. Sozinha, ela oferecia um aumento significativo de AUC e, mais importante, atuava como uma porta: pequenos intervalos dessa característica definem regimes de dados distintos com frequências de interrupção muito diferentes.
A dependência parcial e a análise ICE mostraram que o modelo usa essa característica apenas próxima a limiares estreitos. Cruzar esses limiares direciona amostras para folhas diferentes onde outras características importam, particionando efetivamente o conjunto de dados em regimes (incluindo uma faixa de "negativos fáceis" com taxa positiva muito baixa). Essa interação se traduziu em um ganho significativo de AUC no total.
Julian também explorou várias arquiteturas de deep learning: - Modelos siameses / de embedding para segmentos pré/pós - CNNs focadas em janelas de fronteira - Variantes híbridas LSTM–GARCH - Cabeças personalizadas misturando estatísticas globais, janelas de fronteira e embeddings pré/pós A maioria estabilizou em torno de 65–75% de AUC apesar de ajustes substanciais.
Por que as árvores venceram aqui? Conjuntos de árvores podiam explorar sinais muito locais e de baixa dimensão, como os estreitos limiares CV, enquanto modelos profundos tendiam a suavizá-los por meio da normalização e aprendizado de representações. Dado o cronograma da competição, engenharia de recursos + GBDTs oferecia o melhor equilíbrio entre complexidade, interpretabilidade e desempenho.
Um enorme agradecimento a Julian Mukaj por compartilhar uma análise tão detalhada de sua abordagem, e ao ADIA Lab e a todos os participantes do Crunchers por ultrapassarem os limites da detecção de quebras estruturais. Mais destaques do Cruncher em breve.
3,74K