Ich werde mich als Nächstes mit DBSCAN für das statistische Dashboard beschäftigen und auch Snapshots für einen Entscheidungsbaum speichern, der nach 5-6 Stunden Laufzeit aktiviert wird (2-3 Tage werden mir statistisch relevantere Daten liefern, die ich teilen kann). Mein Hauptziel dabei ist es, idiosynkratische Verhaltensweisen und Ausreißer über 545 Binance-Ticker auf einen Blick zu identifizieren. DBSCAN findet Gruppen basierend auf Dichte, d.h. Punkte, die nahe beieinander liegen, bilden einen Cluster und isolierte Punkte werden als Ausreißer markiert. Der entscheidende Unterschied zu k-means: k-means zwingt jedes Asset in eine Gruppe, egal was passiert. DBSCAN segregiert und identifiziert idiosynkratische Ausreißer in diesem Format tatsächlich besser. Im Dashboard wird derzeit jedes erweiterte Asset gleichzeitig durch 7 Dimensionen beschrieben: > wie erweitert, wie lang/kurz, Geschwindigkeit, Seltenheit, Volumen, BTC-Korrelation und Volatilitätsregime. Hier werde ich es vorerst belassen. Ich sammle einige Daten und werde sie in dem Artikel teilen, an dem ich arbeite.
Stoic
Stoic23. März, 15:04
Ich probiere jetzt k-means-Clustering aus, bei dem die Daten in Gruppen aufgeteilt werden, die auf Ähnlichkeit basieren. In diesem Fall: wird jedes erweiterte Asset betrachtet und fünf Parameter gemessen: wie erweitert das Asset ist, wie lange es schon da ist, wie schnell es sich bewegt, wie selten dieses Niveau ist und wie viel Volumen dahintersteckt. Vier Gruppen sind entstanden: Rauschspike: kam schnell dorthin, bewegt sich bereits zurück. Kurzer Kontakt, wahrscheinlich nicht wert zu traden. Langsame Bewegung: wurde über mehrere Zeitzyklen hinweg erweitert, niedrige Geschwindigkeit. Möglicherweise wird eine gefangene Position aufgebaut. Überfüllte Position: extremen Perzentilrang, moderates Volumen. Squeeze- oder Liquidationsrisiko je nach Richtung. Dünner Markt — niedriges Volumen im Verhältnis zur Erweiterung. Der z-Score ist technisch gültig, benötigt aber mehr Untersuchung. Ein detaillierter Artikel wird folgen, der den gesamten Prozess beschreibt.
TLDR: in den Statistikgräben
8,38K