Cruncher Spotlight #4 – ADIA Lab 結構性突破挑戰 今天我們要特別介紹 Julian Mukaj,M&G Investments 的量化分析師,他在 Crunch 上舉辦的 10 萬美元 ADIA Lab 2025 結構性突破挑戰中表現最佳。
任務:結構性斷裂驗證。 給定一個時間序列和一個提議的變更點,預測在那裡發生真正的結構性斷裂的概率(0–1)——這是一個在金融、氣候、醫療保健、宏觀經濟等領域有應用的問題。
這種方法的核心是特徵多樣性: Julian 建立特徵家族,對比斷裂前後的區段,涵蓋: - 分佈與平穩性 - 波動性和方差結構 - 壓縮與複雜性 - 頻譜內容 - 路徑幾何和極值
統計測試與信息理論特徵 傳統工具如 ADF、KS、Cramér–von Mises、散度和熵量化了邊界上的分佈和穩定性變化。 這些捕捉到最直接的信號:"潛在的運動法則是否改變了?"
變異數與波動性轉換 在 z 正規化的回報上,他層疊了: - 指數加權移動平均(EWMA)波動性 - 滾動標準差 - 標準化殘差(衝擊大小與當地 σ) - MOSUM 風格的變異數窗口 特徵追蹤變異係數、平滑度、波動性聚集和候選斷裂周圍的政權依賴變異數結構。
壓縮與 CuSum 幾何 - Lempel–Ziv 和基於 zlib 的特徵測量序列在分割前後的可壓縮性/結構性。 - 基於 CuSum 的特徵(肘部形狀、尖銳度、殘差的 Wasserstein 距離)突顯了均值水平的變化和邊界處的局部“肘部”。 它們共同揭示了複雜性和均值動態的微妙變化。
光譜、SSA、ROCKET 和路徑特徵 - 光譜和SSA特徵追蹤功率如何在頻率之間重新分配,以及主導模式如何變化。 - 確定性ROCKET變換作為輕量級卷積特徵,捕捉低階統計未能捕捉到的微結構。 - 路徑和極值特徵(回撤、到達峰值/谷值的距離)總結了依賴於狀態的路徑幾何。
最引人注目的發現之一:一個「魔法特徵」——全球變異係數。 單獨來看,它提供了有意義的AUC提升,更重要的是,它充當了一個閘門:這個特徵的微小區間定義了具有非常不同斷裂頻率的不同數據範疇。
部分依賴和ICE分析顯示,模型僅在狹窄的閾值附近使用此特徵。 跨越這些閾值會將樣本路由到不同的葉子,其中其他特徵變得重要,實際上將數據集劃分為不同的範疇(包括一個正率非常低的“簡單負樣本”區域)。 這種互動轉化為整體AUC的顯著增益。
Julian 也探索了幾種深度學習架構: - 用於前/後段的 Siamese / 嵌入模型 - 專注於邊界窗口的 CNN - 混合 LSTM–GARCH 變體 - 自定義頭部混合全球統計、邊界窗口和前/後嵌入 儘管進行了大量調整,大多數模型的 AUC 仍停留在 65–75% 左右。
為什麼樹在這裡獲勝? 樹集成可以利用非常局部、低維度的信號,例如狹窄的交叉驗證閾值,而深度模型則傾向於通過正規化和表示學習來平滑這些信號。 考慮到競賽時間表,特徵工程 + GBDTs 提供了複雜性、可解釋性和性能之間的最佳權衡。
非常感謝 Julian Mukaj 分享他的方法詳細分析,還有 ADIA Lab 及所有參與的 Crunchers 推動結構性斷裂檢測的前沿。 更多 Cruncher 的焦點報導即將推出。
3.71K