X abriu o código do algoritmo de recomendação, e a parte mais impressionante é: zero características manuais. Os sistemas de recomendação tradicionais precisam de uma equipe para escrever engenharia de características, como "segmentação de atividade do usuário", "percentil do número de fãs do autor", "coeficiente de atenuação da popularidade do post". Alterar uma característica pode levar três meses de testes, e mesmo assim pode falhar ao ser lançado. X permite que o Grok Transformer aprenda de forma end-to-end, eliminando toda essa necessidade. Por que isso é importante? A engenharia de características é a maior dívida técnica dos sistemas de recomendação. Características escritas por humanos precisam de manutenção, e as pessoas podem sair, levando ao desaparecimento do conhecimento. Já vi muitas empresas onde a lógica central das características é compreendida apenas por uma pessoa; se essa pessoa sair, todo o sistema se torna uma caixa-preta. Os modelos podem descobrir padrões que os humanos não conseguem imaginar. Você pode achar que "o horário da postagem" é importante, mas o modelo pode descobrir que "o terceiro caractere é um emoji" é ainda mais relevante. A capacidade de indução do cérebro humano é uma piada diante de dados em bilhões. Quando o comportamento muda, o modelo se adapta automaticamente. Não é necessário esperar que o PM apresente uma demanda, não é preciso agendar, nem fazer A/B testing por um ano. Quando os usuários mudam, o modelo também muda. Outro detalhe que muitas pessoas não notaram: eles preveem simultaneamente 15 tipos de comportamento. Curtidas, compartilhamentos e respostas são sinais positivos, com peso positivo. Bloqueios, silenciamentos e denúncias são sinais negativos, com peso negativo. A pontuação final = probabilidade positiva × peso positivo + probabilidade negativa × peso negativo. Não se trata de maximizar a taxa de cliques, mas de maximizar "o que o usuário não odeia". Essa é a verdadeira otimização da experiência do usuário, e não apenas enganar você para clicar e depois se arrepender. Outro destaque do projeto: Isolamento de Candidatos. Durante a inferência, os posts candidatos não podem ver uns aos outros, apenas o contexto do usuário. A vantagem é que a pontuação é estável, pode ser armazenada em cache e não muda por causa de outros posts na mesma rodada. Essa arquitetura utiliza torres duplas para recuperação, Transformer para classificação fina e regras para filtragem, com responsabilidades bem definidas. Rust é usado para partes sensíveis ao desempenho, enquanto Python é usado para o modelo, com uma escolha técnica bastante prática....