Поскольку алгоритм снова стал темой обсуждения, я хочу его защитить. На праздниках я провел небольшой эксперимент, в котором я взял несколько мемов, комиксов и произведений искусства, которые я сделал в прошлом году, и перепостил их как новые публикации. Всего около 10 постов, с интервалом в 12-18 месяцев между оригинальным постом и новым постом - то есть охватывая значительный рост моих подписчиков и множество изменений в алгоритме. Это было безумно, насколько похожи были их метрики, несмотря на это! Было немного шума, но гораздо меньше, чем вы могли бы ожидать. Пара постов показала лучшие результаты во второй раз (один изначально получил около 300 лайков и получил около 6000 во второй раз). Ни один не показал худших результатов. Это не имеет смысла, если вы моделируете алгоритм как капризный набор эвристик. Эвристики изменились, очень сильно, за последний год. Они полностью переписали алгоритм! Так как же те же посты могли показать хорошие результаты? Но это имеет смысл, если вы понимаете, что "алгоритм", который вы испытываете, это не просто, или даже не в первую очередь, продукт того кода, который работает на серверах X. "Алгоритм" - это взаимодействие этого кода с пользовательской базой, которой он показывает посты. Эта пользовательская база генерирует входные данные для кода ранжирования, и различные циклы динамически работают из состояния машины рекомендаций в пользовательскую базу и обратно. (даже grok, который играет некоторую - предположительно на данный момент ограниченную вычислительную - роль в ранжировании постов, как информирован предпочтениями пользователей, так и имеет доступ к живому поиску.) Пользовательская база - это самый большой вход в алгоритм - более уместно, это субстрат, на котором работает и взаимодействует алгоритм. Алгоритм - это колесо, которое вращается на мнении пользователей. Это означает, что "как люди относятся к этому посту, опубликованному этим человеком, в это время" всегда должно быть первой и основной частью любого объяснения, почему пост вел себя так, как он вел, а не какой-то таинственной деталью эвристик рексиса! Так почему эти посты показали хорошие результаты? Ну, посмотрите на них. Комикс о лопате смешной, но с ним также легко взаимодействовать. Это было непреднамеренно с моей стороны при его создании, но оказывается, что очевидный твит-котировка на него - это насмешка над той отраслью, в которой находится человек. Забавные твиты, чтобы прокрутить цитаты. Пост с кодом фигур Хладни показал лучшие результаты, чем мои другие посты с кодом - у него есть видео - но само видео не так привлекательно, и код-гольф - это нишевый интерес, поэтому пост оказался ниже. (это нормально, мне это нравится, и я публикую то, что мне нравится.) Пост о индукционной плите оказался посередине. Это комикс из четырех панелей, он использует мои узнаваемые треугольные персонажи, но он более нишевый и вызывает меньше взаимодействия, чем комикс о лопате. Теперь это не мои идеальные предпочтения для того, что платформа будет вознаграждать. Очевидно, я бы хотел жить в мире, где код-гольф фигур Хладни или мои посты о персонажах LLM стали бы гипервирусными. (мы можем назвать это ThebesPOT.) Но это не то, на что @nikitabier имеет власть! Он не может изменить, насколько люди по-разному взаимодействуют с моими комиксами с одним изображением по сравнению с моими длинными текстами, или сделать нормисов заинтересованными в код-гольфе или анализе главных компонент представлений базовой модели или коротких рассказах о юкагирской космологии. И это нормально! Я очень благодарен, что получаю даже три лайка на некоторых из более нишевых текстов и художественных произведений, которые я публикую - вещи, которые в прошлой жизни я бы никогда не нашел бы ни одной души, чтобы понять, не говоря уже о трех. В качестве другого примера возьмите "постинговые серии", когда несколько успешных постов подряд, кажется, повышают видимость вашего следующего поста. Эти часто приписываются явной функции платформы. (иногда даже теоретизируется как преднамеренная попытка удержать людей в зависимости.) И, возможно, это так, я не знаю - но вы на самом деле можете получить постинговые серии от очень простого "алгоритма", который даже не отслеживает серии, просто с тремя простыми правилами: 1. Ваши новые посты предпочтительно показываются людям, которые недавно взаимодействовали с вами 2. Посты имеют "импульс", поэтому взаимодействия приводят к тому, что больше людей видят пост 3. Психологически люди распознают имена и фотографии профилей, которые они видели недавно, и замедляют прокрутку ленты, чтобы посмотреть, что публикуют знакомые им люди Эти три простых факта - самый важный из которых даже не является фактом о кодовой базе! - дают нам импульс постера. Когда вы на волне, люди вас распознают - возможно, подсознательно, но, возможно, они даже думают: "Черт возьми, этот парень на волне, я должен посмотреть этот пост." Поскольку люди вас распознают, если ваш пост хороший, он может набрать импульс гораздо быстрее - и поскольку есть так много потенциальных зрителей из недавних постов, импульс может продолжать набирать людей, которые вас распознают, дольше, вместо того чтобы нуждаться в раннем прерывании. Эти три правила сами по себе создают серии, без явной эвристики или даже модели в кодовой базе "серии" - чисто из возникающей динамики. ...