Zagłębiam się w DBSCAN, aby stworzyć statystyczny pulpit nawigacyjny, a także przechowuję zrzuty dla drzewa decyzyjnego, które aktywuje się po 5-6 godzinach działania (2-3 dni dadzą mi bardziej statystycznie istotne dane do podzielenia się). Moim głównym celem jest zidentyfikowanie idiosynkratycznego zachowania i wartości odstających w 545 tickerach Binance na pierwszy rzut oka. DBSCAN znajduje grupy na podstawie gęstości, tzn. punkty, które są blisko siebie, tworzą klaster, a izolowane punkty są oznaczane jako wartości odstające. Kluczowa różnica w porównaniu do k-średnich: k-średnie zmuszają każdy aktyw do przynależności do grupy, niezależnie od wszystkiego. DBSCAN w rzeczywistości lepiej segreguje i wydziela idiosynkratyczne wartości odstające w tym formacie. Na pulpicie nawigacyjnym obecnie każdy rozszerzony aktyw opisany jest przez 7 wymiarów jednocześnie: > jak rozszerzony, jak długi/krótki, prędkość, rzadkość, wolumen, korelacja z BTC i reżim zmienności. Na tym na razie kończę. Zbieram dane i podzielę się nimi w artykule, nad którym pracuję.
Stoic
Stoic23 mar, 15:04
Teraz próbuję klastrowania k-średnich, w którym dane są dzielone na grupy na podstawie podobieństwa. W tym przypadku: bierze każdy rozszerzony aktyw i mierzy pięć parametrów: jak bardzo aktyw jest rozszerzony, jak długo tam jest, jak szybko się porusza, jak rzadki jest ten poziom i jak dużo wolumenu za nim stoi. Pojawiły się cztery grupy: Szum: dotarł tam szybko, już wraca. Krótkie dotknięcie, prawdopodobnie nie warto handlować. Powolny wzrost: był rozszerzony przez wiele cykli czasowych, niska prędkość. Potencjalnie pułapka budująca pozycje. Zatłoczona pozycja: ekstremalny percentyl, umiarkowany wolumen. Ryzyko squeeze lub likwidacji w zależności od kierunku. Cienki rynek — niski wolumen w porównaniu do rozszerzenia. Z-score jest technicznie ważny, ale wymaga dalszego zgłębiania. Szczegółowy artykuł na temat całego procesu wkrótce.
TLDR: w statystycznych okopach
8,38K