Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ Điểm nổi bật của Cruncher #8 — Thử thách Đột phá Cấu trúc ADIA Lab
Gặp gỡ Abhishek Gupta (Nhà khoa học dữ liệu @ TraceLink), người đã xếp thứ 8 trong Thử thách Đột phá Cấu trúc trị giá 100.000 đô la trên Crunch.
Dưới đây là trực giác đằng sau cách tiếp cận của anh ấy — không cần toán học phức tạp. 👇

2/ Đầu tiên: "điểm gãy cấu trúc" là gì?
Đó là khi một chuỗi thời gian thay đổi hành vi một cách âm thầm — giống như một thị trường chuyển đổi chế độ, một cảm biến trôi dạt, hoặc một tín hiệu sức khỏe thay đổi.
Cùng một biểu đồ, nhưng quy tắc khác nhau bên dưới.
3/ Nếu bạn bỏ lỡ sự bứt phá:
dự đoán trở nên mong manh
các mô hình trở nên không ổn định
các quyết định được đưa ra dựa trên thực tế của ngày hôm qua
Phát hiện sự bứt phá xuất hiện ở khắp mọi nơi: tài chính, khí hậu, chăm sóc sức khỏe, hoạt động công nghiệp.
4/ Khung thách thức rất đơn giản:
Bạn được cung cấp một chuỗi thời gian và một điểm ranh giới đã được đánh dấu.
Câu hỏi: dữ liệu trước và sau điểm đó có giống như đến từ cùng một quá trình... hay không?
5/ Động thái chính của Abhishek: đừng ép một mô hình giải thích mọi loại chuỗi.
Tập dữ liệu có những "tính cách" khác nhau (mượt mà, ồn ào, bùng nổ, đuôi nặng, tự tương quan).
Vì vậy, anh ấy đã nhóm các chuỗi thời gian thành các cụm (loại), sau đó sử dụng một bộ phát hiện được tùy chỉnh cho mỗi loại.
6/ Đối với nhiều cụm, "mô hình" tốt nhất chỉ là một điểm số mạnh:
Hãy nghĩ: "mức độ phù hợp của chuỗi tốt hơn như thế nào khi chia thành hai đoạn so với một đoạn liên tục?"
Đó về cơ bản là một so sánh theo kiểu tỷ lệ xác suất, rõ ràng và khó để thao túng.
7/ Đối với các cụm khác, anh ấy đã sử dụng ML nhẹ (hồi quy logistic / tập hợp cây / tăng cường gradient) trên các đặc trưng nắm bắt cách mà chuỗi thay đổi:
- sự thay đổi về trung bình/quy mô
- các cú nhảy & sự bùng nổ
- hành vi đuôi
- sự khác biệt phân phối gần ranh giới

8/ Nhập hiệu chuẩn.
Khi bạn chạy các bộ phát hiện khác nhau cho các cụm khác nhau, điểm số của chúng có thể ở các thang đo khác nhau.
Vì vậy, anh ấy đã thêm một lớp hiệu chuẩn để căn chỉnh chúng toàn cầu, từ đó cải thiện hiệu suất xếp hạng tổng thể (AUC).
9/ Bài học chính là rất Crunch:
Hiệu suất mạnh mẽ thường đến từ sự so sánh rõ ràng + các tính năng đa dạng + các mô hình ổn định, chứ không phải kiến trúc nặng nề.
Ngoài ra: anh ấy đã làm điều này mà không cần tinh chỉnh siêu tham số.
573
Hàng đầu
Thứ hạng
Yêu thích
