Vì thuật toán lại là chủ đề được bàn luận, tôi muốn bảo vệ nó. Trong kỳ nghỉ, tôi đã thực hiện một thí nghiệm nhỏ, nơi tôi đã lấy một số meme, truyện tranh và nghệ thuật mà tôi đã làm năm ngoái, và đăng lại chúng như những bài viết mới. Khoảng 10 bài viết tổng cộng, với khoảng cách từ 12-18 tháng giữa bài viết gốc và bài viết mới - vì vậy trải dài qua một sự tăng trưởng lớn trong số người theo dõi của tôi và nhiều thay đổi trong thuật toán. Thật điên rồ khi mà các chỉ số của chúng lại tương tự nhau đến vậy! Có một số tiếng ồn, nhưng ít hơn nhiều so với những gì bạn mong đợi. Một vài bài viết đã làm tốt hơn lần thứ hai (một bài ban đầu nhận được khoảng ~300 lượt thích và nhận được ~6k lượt thích lần thứ hai.) Không có bài nào tệ hơn. Điều này không có lý nếu bạn mô hình hóa thuật toán như một tập hợp các quy tắc tùy hứng. Các quy tắc đã thay đổi, rất nhiều, trong năm qua. Họ đã hoàn toàn viết lại thuật toán! Vậy làm thế nào mà những bài viết giống nhau lại có thể hoạt động tốt? Nhưng điều này hoàn toàn hợp lý nếu bạn hiểu rằng "thuật toán" mà bạn trải nghiệm không chỉ, hoặc thậm chí chủ yếu, là sản phẩm của bất kỳ mã nào đang chạy trên máy chủ của X. "Thuật toán" là sự tương tác của mã đó với cơ sở người dùng mà nó đang hiển thị bài viết. Cơ sở người dùng đó là thứ tạo ra các đầu vào cho mã xếp hạng, và nhiều vòng lặp chạy động từ trạng thái của hệ thống gợi ý vào cơ sở người dùng và quay trở lại. (Ngay cả grok, cái đang đóng một vai trò - có lẽ hiện tại bị giới hạn về tính toán - trong việc xếp hạng bài viết, cũng được thông báo bởi sở thích của người dùng và có quyền truy cập vào tìm kiếm trực tiếp.) Cơ sở người dùng là đầu vào lớn nhất cho thuật toán - chính xác hơn, nó là nền tảng mà thuật toán chạy trên và tương tác với. Thuật toán là một bánh xe quay trên ý kiến của người dùng. Điều đó có nghĩa là "mọi người cảm thấy thế nào về bài viết này, được đăng bởi người này, vào thời điểm này" nên luôn là phần đầu tiên và chính trong bất kỳ lời giải thích nào về lý do tại sao một bài viết lại hành xử như vậy, chứ không phải là một chi tiết bí ẩn nào đó của các quy tắc gợi ý! Vậy tại sao những bài viết này lại hoạt động tốt? Hãy nhìn vào chúng. Truyện tranh về cái xẻng thì hài hước, nhưng cũng dễ để tương tác. Điều này là không cố ý từ phía tôi khi tạo ra nó, nhưng hóa ra câu tweet trích dẫn rõ ràng của nó là châm biếm bất kỳ ngành nào mà người đó đang làm việc. Những tweet vui vẻ để cuộn qua các trích dẫn. Bài viết về mã Chladni figures đã làm tốt hơn các bài viết mã khác của tôi - nó có một video - nhưng video đó không hấp dẫn lắm tự nó, và code golf là một sở thích hẹp, vì vậy bài viết đã hạ xuống thấp hơn. (Điều đó cũng ổn, tôi thích nó, và tôi đăng những gì tôi thích.) Bài viết về bếp từ đã nằm ở giữa. Nó là một truyện tranh bốn khung, nó sử dụng các nhân vật hình tam giác dễ nhận biết của tôi, nhưng nó hẹp hơn và mời gọi ít sự tương tác hơn so với truyện tranh cái xẻng. Bây giờ, đây không phải là những sở thích lý tưởng của tôi cho những gì nền tảng sẽ thưởng. Rõ ràng tôi rất muốn sống trong một thế giới mà mã Chladni figure code golf hoặc các bài viết nghiên cứu về nhân cách LLM của tôi sẽ trở nên siêu viral. (Chúng ta có thể gọi nó là ThebesPOT.) Nhưng đó không phải là điều mà @nikitabier có quyền kiểm soát! Anh ấy không thể thay đổi cách mà mọi người tương tác khác nhau với các truyện tranh một hình ảnh của tôi so với các bài viết dài của tôi, hoặc khiến những người bình thường quan tâm đến code golf hoặc phân tích thành phần chính của các đại diện mô hình cơ sở hoặc những câu chuyện ngắn về vũ trụ học yukaghir. Và điều đó cũng ổn! Tôi rất biết ơn khi nhận được ngay cả ba lượt thích trên một số bài viết và tiểu thuyết hẹp hơn mà tôi đăng - những thứ mà trong một cuộc sống trước đây tôi sẽ không bao giờ tìm thấy một linh hồn nào khác để hiểu, chưa nói đến ba. Như một ví dụ khác, hãy lấy "chuỗi bài đăng," nơi một vài bài viết thành công liên tiếp dường như thúc đẩy bài viết tiếp theo của bạn. Những điều này thường được quy cho một tính năng rõ ràng của nền tảng. (Đôi khi thậm chí được lý thuyết hóa như một nỗ lực cố ý để giữ cho mọi người nghiện.) Và có thể chúng là, tôi không biết - nhưng bạn thực sự có thể có chuỗi bài đăng từ một "thuật toán" rất đơn giản mà thậm chí không theo dõi chuỗi, chỉ với ba quy tắc đơn giản: 1. Các bài viết mới của bạn được hiển thị ưu tiên cho những người đã tương tác với bạn gần đây 2. Các bài viết có "động lực," vì vậy các tương tác dẫn đến nhiều người hơn thấy bài viết 3. Về mặt tâm lý, mọi người nhận ra tên và hình ảnh hồ sơ mà họ đã thấy gần đây, và chậm lại trên dòng thời gian để xem những gì những người mà họ biết đang đăng Ba sự thật đơn giản này - sự thật quan trọng nhất thậm chí không phải là một sự thật về mã nguồn! - mang lại cho chúng ta động lực người đăng. Khi bạn đang trên đà, mọi người nhận ra bạn - có thể là vô thức, nhưng có thể họ thậm chí đang nghĩ "chết tiệt, người này đã có một đà, tôi nên xem bài viết này." Bởi vì mọi người nhận ra bạn, nếu bài viết của bạn tốt, nó có thể có động lực nhanh hơn rất nhiều - và vì có rất nhiều người xem tiềm năng từ các bài viết gần đây, động lực có thể tiếp tục thu hút những người nhận ra bạn lâu hơn, thay vì cần phải phá vỡ sự kiểm soát sớm. Chỉ ba quy tắc này tạo ra chuỗi, mà không có quy tắc rõ ràng nào hoặc thậm chí mô hình nào trong mã nguồn về một "chuỗi" - hoàn toàn từ động lực phát sinh. ...