Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cruncher Spotlight #4 – ADIA Lab Strukturell Bruddutfordring
I dag fremhever vi Julian Mukaj, kvantitativ analytiker hos M&G Investments, for hans best presterende løsning i ADIA Lab 2025 Structural Break Challenge til 100 000 dollar, arrangert på Crunch.

Oppgaven: verifisering av strukturelle brudd.
Gitt en tidsserie og et foreslått endringspunkt, forutsi sannsynligheten (0–1) for at et ekte strukturelt brudd skjedde der – et problem med anvendelser innen finans, klima, helsevesen, makro og mer.
Kjernen i tilnærmingen er funksjonsmangfold:
Julian bygger familier av funksjoner som sammenligner pre- og post-break-segmenter på tvers:
- fordelinger og stasjonaritet
- volatilitets- og variansstruktur
- kompresjon og kompleksitet
- spektralt innhold
- stigeometri og ekstreme
Statistiske tester og informasjonsteoretiske egenskaper
Klassiske verktøy som ADF, KS, Cramér–von Mises, divergenser og entropier kvantifiserer fordelings- og stasjonaritetsskift over grensen.
Disse fanger det mest direkte signalet: «Endret den underliggende bevegelsesloven seg?»
Varians- og volatilitetstransformasjoner
På z-normaliserte returer legger han lag:
- EWMA-volatilitet
- rullende standardavvik
- standardiserte residualer (sjokkstørrelse vs lokal σ)
- MOSUM-stil variansvinduer
Funksjoner sporer variasjonskoeffisient, jevnhet, volatilitetsklyngedannelse og regimeavhengig variansstruktur rundt kandidatbruddet.
Kompresjon og CuSum-geometri
- Lempel–Ziv- og zlib-baserte funksjoner måler hvor komprimerbar/strukturert sekvensen er før versus etter delingen.
- CuSum-baserte egenskaper (albueform, skarphet, Wasserstein-avstander på residualer) fremhever gjennomsnittlige nivåforskyvninger og lokale "albuer" ved grensen.
Sammen avdekker de subtile endringer i kompleksitet og gjennomsnittsdynamikk.
Spektrale, SSA-, ROCKET- og banefunksjoner
- Spectral- og SSA-funksjoner sporer hvordan effekten omfordeles over frekvenser og hvordan dominerende moduser endres.
- Deterministiske ROCKET-transformasjoner fungerer som lette konvolusjonsfunksjoner for å fange mikrostrukturer som ikke fanges opp av lavordens statistikk.
- Sti- og ekstrema-egenskaper (senkninger, avstander til topper/daler) oppsummerer regimeavhengig stigeometri.
En av de mest slående funnene: en «magisk egenskap» – den globale variasjonskoeffisienten.
Alene ga den en meningsfull AUC-boost og, enda viktigere, fungerte som en port: små intervaller av denne funksjonen definerer distinkte dataregimer med svært forskjellige bruddfrekvenser.
Delvis avhengighet og ICE-analyse viste at modellen kun bruker denne funksjonen nær smale terskler.
Å krysse disse tersklene leder prøvene inn i forskjellige blader hvor andre funksjoner er viktige, og deler datasettet effektivt inn i regimer (inkludert et "enkle negativer"-bånd med svært lav positiv rate).
Denne interaksjonen resulterte i en betydelig samlet AUC-gevinst.
Julian utforsket også flere dyp læringsarkitekturer:
- Siamesiske / embedding-modeller for pre/post-segmenter
- CNN-er med fokus på grensevinduer
- Hybride LSTM–GARCH-varianter
- Egendefinerte hoder som blander globale statistikker, grensevinduer og pre/post-embeddinger
De fleste flatet ut rundt 65–75 % AUC til tross for betydelig justering.
Hvorfor vant trær her?
Treensembler kunne utnytte svært lokale, lavdimensjonale signaler som de smale CV-tersklene, mens dype modeller hadde en tendens til å jevne ut disse gjennom normalisering og representasjonslæring.
Gitt konkurransetidslinjen ga funksjonsutvikling + GBDT-er den beste avveiningen mellom kompleksitet, tolkbarhet og ytelse.
Stor takk til Julian Mukaj for å dele en så detaljert gjennomgang av sin tilnærming, og til ADIA Lab og alle deltakende Crunchers for å ha presset grensene for strukturell brudddeteksjon.
Flere Cruncher-spotlights kommer snart.
3,73K
Topp
Rangering
Favoritter

