Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ В центре внимания Cruncher #8 — Вызов структурного разрыва ADIA Lab
Познакомьтесь с Абхишеком Гуптой (Data Scientist @ TraceLink), который занял 8-е место в Вызове структурного разрыва на сумму $100k на Crunch.
Вот интуиция, стоящая за его подходом — никаких сложных математических расчетов не требуется. 👇

2/ Первое: что такое "структурный разрыв"?
Это когда временной ряд тихо меняет свое поведение — как изменение режимов на рынке, дрейф датчика или изменение сигнала здоровья.
Та же диаграмма, но разные правила под ней.
3/ Если вы пропустите прорыв:
прогнозы становятся хрупкими
модели становятся нестабильными
решения принимаются на основе вчерашней реальности
Обнаружение прорыва проявляется повсюду: финансы, климат, здравоохранение, промышленная деятельность.
4/ Формулировка задачи была проста:
Вам дан временной ряд и отмеченная граница.
Вопрос: выглядят ли данные до и после этой точки так, будто они пришли из одного и того же процесса… или нет?
5/ Ключевой шаг Абхишека: не заставляйте одну модель объяснять каждый вид временного ряда.
Набор данных имел разные "личности" (гладкие, шумные, всплесковые, с тяжелым хвостом, автокоррелированные).
Поэтому он сгруппировал временные ряды в кластеры (типы), а затем использовал специализированный детектор для каждого.
6/ Для многих кластеров лучшим «моделью» был просто один сильный балл:
Подумайте: «насколько лучше серия подходит как два сегмента по сравнению с одним непрерывным сегментом?»
Это, по сути, сравнение в стиле отношения правдоподобия, чистое и трудное для манипуляций.
7/ Для других кластеров он использовал легковесное машинное обучение (логистическая регрессия / ансамбли деревьев / градиентный бустинг) на признаках, которые фиксируют, как изменяется ряд:
- сдвиги в среднем/масштабе
- скачки и всплески
- поведение хвоста
- различия в распределении у границы

8/ Введите калибровку.
Когда вы запускаете разные детекторы для разных кластеров, их оценки могут быть на разных шкалах.
Поэтому он добавил слой калибровки, чтобы выровнять их глобально, тем самым улучшив общую производительность ранжирования (AUC).
9/ Мета-урок очень Crunch:
Надежная производительность часто достигается благодаря четким сравнениям + разнообразным функциям + стабильным моделям, а не тяжелой архитектуре.
Также: он сделал это без настройки гиперпараметров.
571
Топ
Рейтинг
Избранное
