Sorotan Cruncher #4 – Tantangan Istirahat Struktural Lab ADIA Hari ini kami menyoroti Julian Mukaj, Analis Kuantitatif di M&G Investments, untuk solusi berkinerja terbaiknya dalam Tantangan Istirahat Struktural ADIA Lab 2025 senilai $100K yang diselenggarakan di Crunch.
Tugas: verifikasi istirahat struktural. Mengingat deret waktu dan titik perubahan yang diusulkan, prediksi probabilitas (0-1) bahwa pemisahan struktural yang sebenarnya terjadi di sana – masalah dengan aplikasi di bidang keuangan, iklim, perawatan kesehatan, makro, dan banyak lagi.
Inti dari pendekatan ini adalah keragaman fitur: Julian membangun keluarga fitur yang membandingkan segmen sebelum vs pasca-istirahat di seluruh segmen sedikit: - Distribusi & Stasioner - struktur volatilitas dan varians - Kompresi & Kompleksitas - konten spektral - geometri jalur dan ekstrem
Tes statistik & fitur teoritis informasi Alat klasik seperti ADF, KS, Cramér-von Mises, divergensi dan entropi mengukur pergeseran distribusi dan stasioner melintasi batas. Ini menangkap sinyal paling langsung: "Apakah hukum gerak yang mendasarinya berubah?"
Varians & volatilitas berubah Pada pengembalian z-normalisasi dia melapisi: - Volatilitas EWMA - Standar deviasi bergulir - residu standar (ukuran guncangan vs σ lokal) - Jendela varians gaya MOSUM Fitur melacak koefisien variasi, kehalusan, pengelompokan volatilitas, dan struktur varians yang bergantung pada rezim di sekitar jeda kandidat.
Kompresi & Geometri CuSum - Fitur berbasis Lempel-Ziv dan zlib mengukur seberapa mudah dikompresi / terstruktur urutan sebelum vs setelah pemisahan. - Fitur berbasis CuSum (bentuk siku, ketajaman, jarak Wasserstein pada residu) menyoroti pergeseran tingkat rata-rata dan "siku" lokal di batas. Bersama-sama, mereka memunculkan perubahan halus dalam kompleksitas dan dinamika rata-rata.
Fitur Spectral, SSA, ROCKET & path - Fitur spektral & SSA melacak bagaimana daya didistribusikan kembali di seluruh frekuensi dan bagaimana mode dominan berubah. - Transformasi ROCKET deterministik bertindak sebagai fitur konvolusional ringan untuk menangkap struktur mikro yang tidak ditangkap oleh statistik tingkat rendah. - Fitur jalur & ekstrem (penarikan, jarak ke puncak/palung) merangkum geometri jalur yang bergantung pada rezim.
Salah satu temuan yang paling mencolok: "fitur ajaib" – koefisien variasi global. Dengan sendirinya, ini menawarkan dorongan AUC yang berarti dan, yang lebih penting, bertindak sebagai gerbang: interval kecil dari fitur ini mendefinisikan rezim data yang berbeda dengan frekuensi jeda yang sangat berbeda.
Ketergantungan parsial dan analisis ICE menunjukkan bahwa model hanya menggunakan fitur ini di dekat ambang batas yang sempit. Melintasi ambang batas tersebut merutekan sampel ke daun yang berbeda di mana fitur lain penting, secara efektif mempartisi kumpulan data ke dalam rezim (termasuk pita "negatif mudah" dengan tingkat positif yang sangat rendah). Interaksi ini diterjemahkan ke dalam keuntungan AUC keseluruhan yang signifikan.
Julian juga mengeksplorasi beberapa arsitektur pembelajaran mendalam: - Model Siam / penyematan untuk segmen pra/pasca - CNN berfokus pada jendela batas - Varian LSTM–GARCH hibrida - Kepala khusus yang memadukan statistik global, jendela batas, dan penyematan pra/pasca Sebagian besar dataran tinggi sekitar 65-75% AUC meskipun penyetelan substansial.
Mengapa pohon menang di sini? Ansambel pohon dapat mengeksploitasi sinyal dimensi rendah yang sangat lokal seperti ambang CV yang sempit, sementara model dalam cenderung menghaluskannya melalui normalisasi dan pembelajaran representasi. Mengingat garis waktu kompetisi, rekayasa fitur + GBDT menawarkan trade-off terbaik antara kompleksitas, interpretabilitas, dan kinerja.
Terima kasih banyak kepada Julian Mukaj karena telah membagikan rincian pendekatannya, dan kepada ADIA Lab dan semua Cruncher yang berpartisipasi karena telah mendorong batas deteksi kerusakan struktural. Lebih banyak sorotan Cruncher segera hadir.
3,71K