Cruncher Spotlight #4 – ADIA Lab 结构性突破挑战 今天我们要重点介绍 Julian Mukaj,M&G Investments 的量化分析师,他在 Crunch 上举办的 10 万美元 ADIA Lab 2025 结构性突破挑战中表现出色。
任务:结构性断裂验证。 给定一个时间序列和一个提议的变更点,预测在该点发生真实结构性断裂的概率(0–1)——这是一个在金融、气候、医疗、宏观等领域有应用的问题。
该方法的核心是特征多样性: Julian 构建特征家族,比较断裂前后区段的: - 分布与平稳性 - 波动性和方差结构 - 压缩与复杂性 - 频谱内容 - 路径几何和极值
统计测试与信息论特征 经典工具如ADF、KS、Cramér–von Mises、散度和熵量化了跨越边界的分布和平稳性变化。 这些捕捉到最直接的信号:“基础运动法则是否发生了变化?”
方差与波动性变换 在z标准化收益上,他叠加了: - EWMA波动性 - 滚动标准差 - 标准化残差(冲击大小与局部σ的比较) - MOSUM风格的方差窗口 特征跟踪变异系数、平滑度、波动性聚集和候选断点周围的状态依赖方差结构。
压缩与CuSum几何 - Lempel–Ziv和基于zlib的特征测量序列在分割前后有多可压缩/结构化。 - 基于CuSum的特征(肘部形状、尖锐度、残差的Wasserstein距离)突出显示均值水平的变化和边界处的局部“肘部”。 它们共同揭示了复杂性和均值动态的微妙变化。
光谱、SSA、ROCKET 和路径特征 - 光谱和SSA特征跟踪功率如何在频率间重新分配以及主导模式如何变化。 - 确定性ROCKET变换作为轻量级卷积特征,捕捉低阶统计未能捕捉到的微观结构。 - 路径和极值特征(回撤、到峰值/谷值的距离)总结了与状态相关的路径几何。
最引人注目的发现之一:一个“魔法特征”——全球变异系数。 单独来看,它提供了有意义的AUC提升,更重要的是,它充当了一个门槛:这个特征的微小区间定义了具有非常不同断裂频率的不同数据状态。
部分依赖和ICE分析表明,该模型仅在狭窄的阈值附近使用此特征。 跨越这些阈值会将样本路由到不同的叶子节点,在那里其他特征变得重要,有效地将数据集划分为不同的状态(包括一个具有非常低正率的“简单负样本”带)。 这种交互转化为整体AUC的显著提升。
Julian 还探索了几种深度学习架构: - 用于前/后段的孪生/嵌入模型 - 专注于边界窗口的 CNN - 混合 LSTM–GARCH 变体 - 自定义头部,混合全局统计、边界窗口和前/后嵌入 尽管进行了大量调优,大多数模型的 AUC 仍停留在 65%–75% 之间。
为什么树在这里获胜? 树集成可以利用非常局部、低维的信号,比如狭窄的交叉验证阈值,而深度模型往往通过归一化和表示学习将这些信号平滑掉。 考虑到竞争时间线,特征工程 + GBDTs 在复杂性、可解释性和性能之间提供了最佳的权衡。
非常感谢Julian Mukaj分享如此详细的他的方法解析,以及感谢ADIA Lab和所有参与的Crunchers推动结构性突破检测的前沿。 更多Cruncher的聚光灯即将到来。
3.71K