Cruncher Spotlight #4 – ADIA Lab Strukturbruch-Herausforderung Heute heben wir Julian Mukaj, Quantitativer Analyst bei M&G Investments, für seine leistungsstärkste Lösung in der $100K ADIA Lab 2025 Strukturbruch-Herausforderung hervor, die auf Crunch veranstaltet wird.
Die Aufgabe: Überprüfung des strukturellen Bruchs. Gegeben ist eine Zeitreihe und ein vorgeschlagener Wechselpunkt, um die Wahrscheinlichkeit (0–1) vorherzusagen, dass dort ein echter struktureller Bruch aufgetreten ist – ein Problem mit Anwendungen in Finanzen, Klima, Gesundheitswesen, Makro und mehr.
Im Mittelpunkt des Ansatzes steht die Merkmalsvielfalt: Julian erstellt Familien von Merkmalen, die Vor- und Nach-Break-Segmente vergleichen hinsichtlich: - Verteilungen & Stationarität - Volatilität und Varianzstruktur - Kompression & Komplexität - spektralen Inhalten - Pfadgeometrie und Extrema
Statistische Tests & informationstheoretische Merkmale Klassische Werkzeuge wie ADF, KS, Cramér–von Mises, Divergenzen und Entropien quantifizieren Verteilungs- und Stationaritätsverschiebungen über die Grenze. Diese erfassen das direkteste Signal: „Hat sich das zugrunde liegende Bewegungsgesetz geändert?“
Varianz- und Volatilitäts-Transformationen Auf z-normalisierten Renditen schichtet er: - EWMA-Volatilität - rollierende Standardabweichungen - standardisierte Residuen (Schockgröße vs. lokale σ) - MOSUM-Stil Varianzfenster Die Merkmale verfolgen den Variationskoeffizienten, die Glattheit, die Volatilitätscluster und die regimespezifische Varianzstruktur um den Kandidatenbruch.
Kompression & CuSum-Geometrie - Lempel–Ziv- und zlib-basierte Merkmale messen, wie komprimierbar / strukturiert die Sequenz vor und nach der Teilung ist. - CuSum-basierte Merkmale (Ellbogenform, Schärfe, Wasserstein-Abstände auf Residuen) heben Mittelwertverschiebungen und lokale "Ellbogen" an der Grenze hervor. Zusammen zeigen sie subtile Veränderungen in der Komplexität und den mittleren Dynamiken.
Spektrale, SSA, ROCKET- und Pfadmerkmale - Spektrale und SSA-Merkmale verfolgen, wie sich die Leistung über Frequenzen umverteilt und wie sich dominante Modi ändern. - Deterministische ROCKET-Transformationen fungieren als leichte konvolutionale Merkmale, um Mikrostrukturen zu erfassen, die von niedrigordentlichen Statistiken nicht erfasst werden. - Pfad- und Extrema-Merkmale (Rückgänge, Abstände zu Spitzen/Tälern) fassen die regimespezifische Pfadgeometrie zusammen.
Eine der auffälligsten Erkenntnisse: eine „magische Funktion“ – der globale Variationskoeffizient. Für sich allein bot er einen bedeutenden AUC-Boost und, was noch wichtiger ist, fungierte als Tor: winzige Intervalle dieser Funktion definieren unterschiedliche Datenregime mit sehr unterschiedlichen Bruchfrequenzen.
Die partielle Abhängigkeit und die ICE-Analyse zeigten, dass das Modell dieses Merkmal nur in der Nähe enger Schwellenwerte verwendet. Das Überschreiten dieser Schwellenwerte leitet Proben in verschiedene Blätter, in denen andere Merkmale wichtig sind, und partitioniert effektiv den Datensatz in Regime (einschließlich eines „einfachen Negativ“-Bereichs mit sehr niedriger positiver Rate). Diese Interaktion führte zu einem signifikanten Anstieg des gesamten AUC.
Julian hat auch mehrere Deep-Learning-Architekturen erkundet: - Siamese / Einbettungsmodelle für Vor-/Nachsegmente - CNNs, die sich auf Grenzfenster konzentrieren - Hybride LSTM–GARCH-Varianten - Benutzerdefinierte Köpfe, die globale Statistiken, Grenzfenster und Vor-/Nach-Einbettungen mischen Die meisten erreichten ein Plateau von etwa 65–75% AUC trotz umfangreicher Feinabstimmung.
Warum haben Bäume hier gewonnen? Baum-Ensembles könnten sehr lokale, niederdimensionale Signale wie die engen CV-Schwellenwerte nutzen, während tiefe Modelle dazu neigten, diese durch Normalisierung und Repräsentationslernen zu glätten. Angesichts des Zeitplans des Wettbewerbs boten Feature Engineering + GBDTs den besten Kompromiss zwischen Komplexität, Interpretierbarkeit und Leistung.
Ein riesiges Dankeschön an Julian Mukaj für die detaillierte Aufschlüsselung seines Ansatzes und an das ADIA Lab sowie alle teilnehmenden Crunchers, die die Grenzen der strukturellen Bruchdetektion erweitern. Weitere Cruncher-Spotlights kommen bald.
3,73K