Cruncher Spotlight #4 – ADIA Lab Strukturell Bruddutfordring I dag fremhever vi Julian Mukaj, kvantitativ analytiker hos M&G Investments, for hans best presterende løsning i ADIA Lab 2025 Structural Break Challenge til 100 000 dollar, arrangert på Crunch.
Oppgaven: verifisering av strukturelle brudd. Gitt en tidsserie og et foreslått endringspunkt, forutsi sannsynligheten (0–1) for at et ekte strukturelt brudd skjedde der – et problem med anvendelser innen finans, klima, helsevesen, makro og mer.
Kjernen i tilnærmingen er funksjonsmangfold: Julian bygger familier av funksjoner som sammenligner pre- og post-break-segmenter på tvers: - fordelinger og stasjonaritet - volatilitets- og variansstruktur - kompresjon og kompleksitet - spektralt innhold - stigeometri og ekstreme
Statistiske tester og informasjonsteoretiske egenskaper Klassiske verktøy som ADF, KS, Cramér–von Mises, divergenser og entropier kvantifiserer fordelings- og stasjonaritetsskift over grensen. Disse fanger det mest direkte signalet: «Endret den underliggende bevegelsesloven seg?»
Varians- og volatilitetstransformasjoner På z-normaliserte returer legger han lag: - EWMA-volatilitet - rullende standardavvik - standardiserte residualer (sjokkstørrelse vs lokal σ) - MOSUM-stil variansvinduer Funksjoner sporer variasjonskoeffisient, jevnhet, volatilitetsklyngedannelse og regimeavhengig variansstruktur rundt kandidatbruddet.
Kompresjon og CuSum-geometri - Lempel–Ziv- og zlib-baserte funksjoner måler hvor komprimerbar/strukturert sekvensen er før versus etter delingen. - CuSum-baserte egenskaper (albueform, skarphet, Wasserstein-avstander på residualer) fremhever gjennomsnittlige nivåforskyvninger og lokale "albuer" ved grensen. Sammen avdekker de subtile endringer i kompleksitet og gjennomsnittsdynamikk.
Spektrale, SSA-, ROCKET- og banefunksjoner - Spectral- og SSA-funksjoner sporer hvordan effekten omfordeles over frekvenser og hvordan dominerende moduser endres. - Deterministiske ROCKET-transformasjoner fungerer som lette konvolusjonsfunksjoner for å fange mikrostrukturer som ikke fanges opp av lavordens statistikk. - Sti- og ekstrema-egenskaper (senkninger, avstander til topper/daler) oppsummerer regimeavhengig stigeometri.
En av de mest slående funnene: en «magisk egenskap» – den globale variasjonskoeffisienten. Alene ga den en meningsfull AUC-boost og, enda viktigere, fungerte som en port: små intervaller av denne funksjonen definerer distinkte dataregimer med svært forskjellige bruddfrekvenser.
Delvis avhengighet og ICE-analyse viste at modellen kun bruker denne funksjonen nær smale terskler. Å krysse disse tersklene leder prøvene inn i forskjellige blader hvor andre funksjoner er viktige, og deler datasettet effektivt inn i regimer (inkludert et "enkle negativer"-bånd med svært lav positiv rate). Denne interaksjonen resulterte i en betydelig samlet AUC-gevinst.
Julian utforsket også flere dyp læringsarkitekturer: - Siamesiske / embedding-modeller for pre/post-segmenter - CNN-er med fokus på grensevinduer - Hybride LSTM–GARCH-varianter - Egendefinerte hoder som blander globale statistikker, grensevinduer og pre/post-embeddinger De fleste flatet ut rundt 65–75 % AUC til tross for betydelig justering.
Hvorfor vant trær her? Treensembler kunne utnytte svært lokale, lavdimensjonale signaler som de smale CV-tersklene, mens dype modeller hadde en tendens til å jevne ut disse gjennom normalisering og representasjonslæring. Gitt konkurransetidslinjen ga funksjonsutvikling + GBDT-er den beste avveiningen mellom kompleksitet, tolkbarhet og ytelse.
Stor takk til Julian Mukaj for å dele en så detaljert gjennomgang av sin tilnærming, og til ADIA Lab og alle deltakende Crunchers for å ha presset grensene for strukturell brudddeteksjon. Flere Cruncher-spotlights kommer snart.
3,71K