Я собираюсь заняться DBSCAN для статистической панели и также хранить снимки для дерева решений, которое активируется через 5-6 часов работы (2-3 дня дадут мне более статистически значимые данные для обмена) Моя основная цель с этим - иметь возможность выявлять идиосинкразическое поведение и выбросы по 545 тикерам Binance одним быстрым взглядом. DBSCAN находит группы на основе плотности, т.е. точки, которые находятся близко друг к другу, образуют кластер, а изолированные точки помечаются как выбросы. Ключевое отличие от k-средних: k-средние заставляют каждый актив попасть в группу, независимо от обстоятельств. DBSCAN на самом деле лучше сегрегирует и выделяет идиосинкразические выбросы в этом формате. В текущей панели каждый расширенный актив описывается одновременно по 7 измерениям > насколько расширен, насколько длинный/короткий, скорость, редкость, объем, корреляция с BTC и режим волатильности. На этом я пока что закончу. Собираю данные и поделюсь ими в статье, над которой работаю.
Stoic
Stoic23 мар., 15:04
Сейчас пробую кластеризацию k-средних, при которой данные разбиваются на группы по сходству. В данном случае: она берет каждый расширенный актив и измеряет пять параметров: насколько расширен актив, как долго он существует, как быстро он движется, насколько редкий этот уровень и какой объем за ним стоит. Выделились четыре группы: Шумовой всплеск: добрался быстро, уже возвращается назад. Краткое касание, вероятно, не стоит торговли. Медленный рост: был расширен на протяжении нескольких временных циклов, низкая скорость. Потенциально формируется ловушка для позиций. Переполненная позиция: экстремальный процентиль, умеренный объем. Риск сжатия или ликвидации в зависимости от направления. Тонкий рынок — низкий объем относительно расширения. Z-оценка технически действительна, но требует дальнейшего изучения. Подробная статья будет опубликована о всем процессе.
Кратко: в статистических окопах
8,38K