X открыл исходный код алгоритма рекомендаций, и самое жесткое в этом: ноль ручных признаков. Традиционным рекомендательным системам нужно много людей для написания инженерии признаков, такие как "группировка активности пользователей", "квантиль числа подписчиков автора", "коэффициент затухания популярности поста". Изменить один признак может занять три месяца, а при запуске это может привести к провалу. X напрямую использует Grok Transformer для обучения от начала до конца, полностью устранив эту систему. Почему это так важно? Инженерия признаков — это самый большой технический долг рекомендательных систем. Признаки, написанные людьми, требуют поддержки, люди могут уйти, знания могут быть утеряны. Я видел слишком много компаний, где основная логика признаков понятна только одному человеку, и когда этот человек уходит, вся система становится черным ящиком. Модель может обнаруживать паттерны, о которых человек не догадывается. Вы считаете, что "время публикации" важно, а модель может обнаружить, что "третий символ — это emoji" более важно. Индуктивные способности человеческого мозга перед миллиардами данных — это просто шутка. Если поведение изменилось, модель автоматически адаптируется. Не нужно ждать, пока PM предложит требования, не нужно планировать, не нужно A/B тестировать год. Пользователь изменился, модель меняется вместе с ним. Есть еще один нюанс, на который многие не обращают внимания: они одновременно предсказывают 15 видов поведения. Лайки, репосты, ответы — это положительные сигналы, вес положительный. Блокировка, отключение звука, жалобы — это отрицательные сигналы, вес отрицательный. Конечный балл = положительная вероятность × положительный вес + отрицательная вероятность × отрицательный вес Не максимизация кликабельности, а максимизация "пользователь не недоволен". Вот это настоящая оптимизация пользовательского опыта, а не обман, чтобы вы кликнули и потом пожалели. Еще одна инженерная особенность: изоляция кандидатов. Во время вывода выбранные посты не могут видеть друг друга, они могут видеть только контекст пользователя. Преимущество в том, что баллы стабильны, их можно кэшировать, и они не будут меняться из-за других постов в одной и той же партии. Эта архитектура использует двойные башни для реколла, Transformer для точной сортировки и правила для фильтрации, с четким разделением обязанностей. Часть, чувствительная к производительности, написана на Rust, модель написана на Python, выбор технологий также очень практичен....