Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
X đã mở mã nguồn thuật toán gợi ý, điều đáng chú ý nhất là: không cần đặc trưng thủ công.
Hệ thống gợi ý truyền thống cần một đám người viết kỹ thuật đặc trưng, như "phân loại mức độ hoạt động của người dùng", "phân vị số lượng người hâm mộ của tác giả", "hệ số suy giảm độ nóng của bài viết", thay đổi một đặc trưng mất ba tháng, lên sóng còn có thể thất bại.
X trực tiếp để Grok Transformer học từ đầu đến cuối, loại bỏ toàn bộ hệ thống này.
Tại sao điều này lại quan trọng?
Kỹ thuật đặc trưng là khoản nợ công nghệ lớn nhất của hệ thống gợi ý. Đặc trưng do con người viết, con người phải bảo trì, con người có thể nghỉ việc, kiến thức sẽ bị mất. Tôi đã thấy quá nhiều công ty, logic đặc trưng cốt lõi chỉ có một người hiểu, người đó ra đi, toàn bộ hệ thống trở thành hộp đen.
Mô hình có thể phát hiện ra những mẫu mà con người không thể nghĩ tới. Bạn nghĩ "thời gian đăng bài" quan trọng, mô hình có thể phát hiện "ký tự thứ ba là emoji" quan trọng hơn. Khả năng quy nạp của bộ não con người trước hàng tỷ dữ liệu chỉ là một trò cười.
Hành vi thay đổi, mô hình tự động thích ứng. Không cần chờ PM đưa ra yêu cầu, không cần lập lịch, không cần A/B test một năm. Người dùng thay đổi, mô hình cũng thay đổi theo.
Còn một chi tiết nhiều người không chú ý: họ đồng thời dự đoán 15 loại hành vi.
Thích, chia sẻ, trả lời là tín hiệu tích cực, trọng số là dương. Chặn, tắt tiếng, báo cáo là tín hiệu tiêu cực, trọng số là âm.
Điểm cuối cùng = xác suất tích cực × trọng số dương + xác suất tiêu cực × trọng số âm.
Không phải tối đa hóa tỷ lệ nhấp chuột, mà là tối đa hóa "người dùng không ghét".
Đây mới thực sự là tối ưu hóa trải nghiệm người dùng, chứ không phải lừa bạn nhấp vào rồi hối hận.
Một điểm nổi bật khác của kỹ thuật: Cách ly ứng viên.
Trong quá trình suy diễn, các bài viết được chọn không thể nhìn thấy nhau, chỉ có thể xem ngữ cảnh của người dùng. Lợi ích là điểm số ổn định, có thể lưu trữ, không bị thay đổi vì có bài viết khác trong cùng một nhóm.
Cấu trúc này, hồi phục sử dụng hai tháp, tinh lọc sử dụng Transformer, lọc sử dụng quy tắc, trách nhiệm rõ ràng.
Rust viết phần nhạy cảm về hiệu suất, Python viết mô hình, lựa chọn công nghệ cũng rất thực tế....

Hàng đầu
Thứ hạng
Yêu thích
