estou a aprofundar-me no DBSCAN a seguir para o painel estatístico e também a armazenar instantâneas para uma árvore de decisão que é ativada após 5-6 horas de funcionamento (2-3 dias dar-me-ão dados estatisticamente mais relevantes para partilhar) o meu objetivo principal com isto é ser capaz de identificar comportamentos idiossincráticos e outliers em 545 tickers da Binance com um rápido olhar. O DBSCAN encontra grupos com base na densidade, ou seja, pontos que estão próximos uns dos outros tornam-se um cluster e pontos isolados são sinalizados como outliers. A principal diferença em relação ao k-means: o k-means força cada ativo a entrar num grupo, não importa o quê. O DBSCAN realmente segrega e separa melhor os outliers idiossincráticos neste formato. No painel atualmente, cada ativo estendido é descrito por 7 dimensões simultaneamente > quão estendido, quão longo/curto, velocidade, raridade, volume, correlação com o BTC e regime de volatilidade. É aqui que vou parar por agora. Estou a reunir alguns dados e irei partilhá-los no artigo em que estou a trabalhar.
Stoic
Stoic23/03, 15:04
A experimentar agora a clusterização k-means, onde os dados são divididos em grupos com base na similaridade. Neste caso: ele toma cada ativo estendido e mede cinco parâmetros: quão estendido o ativo está, há quanto tempo está lá, quão rápido está a mover-se, quão raro é esse nível e quanto volume está por trás disso. Quatro grupos emergiram: Pico de ruído: chegou lá rápido, já está a voltar. Toque breve, provavelmente não vale a pena negociar. Lenta subida: esteve estendido por múltiplos ciclos de tempo, baixa velocidade. Potencialmente uma posição presa a ser construída. Posição lotada: percentil extremo, volume moderado. Risco de squeeze ou liquidação dependendo da direção. Mercado fino — baixo volume em relação à extensão. O z-score é tecnicamente válido, mas precisa de mais investigação. Artigo detalhado a seguir sobre todo o processo.
Resumo: nas trincheiras das estatísticas
8,38K