Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
X ha open-sourcato l'algoritmo di raccomandazione, la cosa più impressionante è: zero caratteristiche manuali.
I tradizionali sistemi di raccomandazione richiedono un sacco di persone per scrivere l'ingegneria delle caratteristiche, come "bucket di attività degli utenti", "percentili del numero di fan degli autori", "coefficiente di decadimento della popolarità dei post", modificare una caratteristica richiede tre mesi di test, e una volta online potrebbe anche fallire.
X ha direttamente permesso a Grok Transformer di apprendere end-to-end, eliminando completamente questo sistema.
Perché è così importante?
L'ingegneria delle caratteristiche è il più grande debito tecnico dei sistemi di raccomandazione. Le caratteristiche scritte da persone devono essere mantenute, le persone possono lasciare, e la conoscenza può andare persa. Ho visto troppe aziende in cui la logica delle caratteristiche principali è compresa solo da una persona; se quella persona se ne va, l'intero sistema diventa una scatola nera.
Il modello può scoprire schemi che gli esseri umani non possono immaginare. Tu pensi che "l'orario di pubblicazione" sia importante, il modello potrebbe scoprire che "il terzo carattere è un'emoji" è più importante. La capacità di induzione del cervello umano è una barzelletta di fronte a miliardi di dati.
Se il comportamento cambia, il modello si adatta automaticamente. Non è necessario aspettare che il PM proponga richieste, non è necessario pianificare, non è necessario A/B testare per un anno. Se gli utenti cambiano, il modello cambia di conseguenza.
C'è anche un dettaglio che molte persone non hanno notato: prevedono contemporaneamente 15 tipi di comportamenti.
Mi piace, condivisione, risposta sono segnali positivi, il peso è positivo. Bloccare, silenziare, segnalare sono segnali negativi, il peso è negativo.
Il punteggio finale = probabilità positiva × peso positivo + probabilità negativa × peso negativo.
Non si tratta di massimizzare il tasso di clic, ma di massimizzare "l'assenza di antipatia da parte dell'utente".
Questa è la vera ottimizzazione dell'esperienza utente, non un modo per farti cliccare e poi farti pentire.
Un altro punto di forza ingegneristico: Isolamento dei Candidati.
Durante l'inferenza, i post candidati non possono vedersi a vicenda, possono solo vedere il contesto dell'utente. Il vantaggio è che il punteggio è stabile, può essere memorizzato nella cache e non cambia a causa di altri post nella stessa batch.
Questa architettura utilizza un doppio tower per il richiamo, un Transformer per la classificazione fine, e regole per il filtraggio, con ruoli ben definiti.
Rust scrive le parti sensibili alle prestazioni, Python scrive il modello, la scelta tecnologica è anche molto pragmatica....

Principali
Ranking
Preferiti
