Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
X hat den Empfehlungsalgorithmus Open Source gemacht, und das Beste daran ist: null manuelle Merkmale.
Traditionelle Empfehlungssysteme benötigen eine Menge Leute, die Merkmalsengineering betreiben, wie "Benutzeraktivitätsstufen", "Autor-Follower-Quantile", "Post-Hitzedämpfungskoeffizient". Ein Merkmal zu ändern kann drei Monate dauern, und wenn es live geht, kann es auch schiefgehen.
X lässt Grok Transformer direkt end-to-end lernen und hat damit das gesamte System abgeschafft.
Warum ist das wichtig?
Merkmalsengineering ist die größte technische Schuld von Empfehlungssystemen. Menschen schreiben Merkmale, Menschen müssen sie pflegen, Menschen können gehen, Wissen kann verloren gehen. Ich habe zu viele Unternehmen gesehen, in denen die Kernmerkmalslogik nur von einer Person verstanden wird. Wenn diese Person geht, wird das gesamte System zu einer Black Box.
Modelle können Muster entdecken, die Menschen nicht erkennen können. Du denkst, "Postzeit" ist wichtig, das Modell könnte entdecken, dass "das dritte Zeichen ein Emoji ist" wichtiger ist. Die Induktionsfähigkeit des menschlichen Gehirns ist vor Milliarden von Daten ein Witz.
Wenn sich das Verhalten ändert, passt sich das Modell automatisch an. Man muss nicht auf die Anforderungen des PM warten, keine Zeitpläne aufstellen, kein A/B-Testing für ein Jahr durchführen. Wenn sich die Benutzer ändern, ändert sich das Modell mit ihnen.
Ein weiteres Detail, das viele nicht bemerken: Sie sagen gleichzeitig 15 Verhaltensweisen voraus.
Likes, Shares, Antworten sind positive Signale, das Gewicht ist positiv. Blockieren, Stummschalten, Melden sind negative Signale, das Gewicht ist negativ.
Endpunktzahl = positive Wahrscheinlichkeit × positives Gewicht + negative Wahrscheinlichkeit × negatives Gewicht
Es geht nicht darum, die Klickrate zu maximieren, sondern darum, "dass die Benutzer nicht unzufrieden sind".
Das ist echte Benutzererfahrungsoptimierung und nicht, dich dazu zu bringen, darauf zu klicken und es dann zu bereuen.
Ein weiteres Highlight des Projekts: Candidate Isolation.
Während der Inferenz können die ausgewählten Posts sich nicht gegenseitig sehen, sondern nur den Benutzerkontext. Der Vorteil ist, dass die Punktzahlen stabil sind, man kann sie cachen, und sie ändern sich nicht, nur weil es andere Posts in derselben Charge gibt.
Diese Architektur verwendet für die Rückgewinnung Dual-Tower, für die Feinabstimmung Transformer und für die Filterung Regeln, mit klaren Verantwortlichkeiten.
Rust wird für leistungs-sensitive Teile verwendet, Python für das Modell, die technische Auswahl ist ebenfalls sehr pragmatisch....

Top
Ranking
Favoriten
