Am început să analizez DBSCAN pentru dashboard-ul statistic și să stochez și snapshot-uri pentru un arbore decizional care se activează după 5-6 ore de rulare (2-3 zile îmi vor oferi date statistic relevante de împărtășit) Scopul meu principal este să pot identifica comportamentele idiosincratice și valorile atipice din 545 de tickeri Binance dintr-o privire rapidă. DBSCAN găsește grupuri bazate pe densitate, adică punctele apropiate devin un cluster, iar punctele izolate sunt marcate ca valori aberante. Diferența cheie față de k-means: k-means forțează fiecare activ să intre într-un grup, indiferent de situație. DBSCAN de fapt segregă și analizează mai bine excepțiile idiosincratice în acest format. În prezent, în dashboard, fiecare activ extins este descris simultan prin 7 dimensiuni > cât de extins, cât de lung/scurt, viteza, raritatea, volumul, corelația BTC și regimul de volatilitate. Aici o să mă opresc deocamdată. Adun niște date și le voi împărtăși în articolul la care lucrez.
Stoic
Stoic23 mar., 15:04
Încercarea k înseamnă acum clusterizarea, prin care datele sunt împărțite în grupuri folosind similaritatea. În acest caz: Ia fiecare activ extins și măsoară cinci parametri: cât de extins este activul, de cât timp este acolo, cât de repede se mișcă, cât de rar este acel nivel și cât volum este în spatele lui. Au apărut patru grupuri: Vârf de zgomot: am ajuns repede, deja mă întorc. O atingere scurtă, probabil nu merită schimbată. Grind lent: a fost prelungit pe mai multe cicluri temporale, viteză mică. Construirea poziționării potențial prinsă. Poziție aglomerată: rang percentil extrem, volum moderat. Riscul de squeeze sau lichidare depinde de direcție. Piață subțire — volum redus în raport cu extinderea. Scorul z este tehnic valid, dar necesită o investigație mai detaliată. Urmează un articol detaliat despre întregul proces.
Pe scurt: în tranșeele statisticilor
8,38K