次に統計ダッシュボードのためにDBSCANを使い、意思決定ツリー用のスナップショットを保存します。これは5〜6時間の実行後に起動します(2〜3日でより統計的に関連性の高いデータが得られます)。 私の主な目的は、545のBinanceティッカー全体で特異な行動や異常値を一目で特定することです。 DBSCANは密度に基づいてグループを見つけます。つまり、近い点はクラスタとなり、孤立した点は外れ値としてフラグ付けされます。 k-meansとの主な違いは、k-meansはどんな場合でもすべての資産をグループに強制的に組み込むことです。 DBSCANはこの形式で、特異な例外をよりよく分離・解析できます。 現在、ダッシュボードでは各拡張資産が同時に7つの次元で記述されています >、どれくらいの長期、どれだけロング/ショート、速度、レアリティ、ボリューム、BTCの相関、ボラティリティのレギュレーションかを把握しています。 ここまではここで終わりにします。データを集めて、私が執筆中の記事で共有する予定です。
Stoic
Stoic3月23日 15:04
kを試すということは、今度はクラスタリングを行い、データを類似性に基づいてグループに分けます。 この場合: すべての拡張資産を取り込み、5つのパラメータを測定します。 資産がどれだけ伸びているか、どれくらいの期間そこにいるのか、どれくらい速く動いているのか、そのレベルがどれほど珍しいのか、そして背後にどれだけのボリュームがあるか。 4つのグループが生まれました。 ノイズの急増:すぐに到着し、すでに後退しています。短いタッチで、おそらくトレードする価値はないでしょう。 スローグラインド:複数のタイムサイクルで延長され、速度は低くなっています。ポジショニングビルに閉じ込められている可能性があります。 混み合うポジション:極端なパーセンタイルランク、中程度のボリューム。方向によっては、スクイーズか清算のリスクがある。 薄市場 — 拡張に比べて取引量が少ない。Zスコアは技術的には有効ですが、さらに掘り下げる必要があります。 全過程について詳しい記事をご紹介します。
要約:統計の現場で
8.38K