X otworzył kod źródłowy algorytmu rekomendacji, a najważniejszą rzeczą jest: zero ręcznych cech. Tradycyjne systemy rekomendacji wymagają zespołu ludzi do pisania inżynierii cech, takich jak "klasyfikacja aktywności użytkowników", "kwantyl liczby fanów autora", "współczynnik spadku popularności postów". Zmiana jednej cechy może trwać trzy miesiące, a po wdrożeniu może się nie udać. X bezpośrednio pozwala Grok Transformerowi uczyć się end-to-end, eliminując całą tę procedurę. Dlaczego to jest ważne? Inżynieria cech to największy dług technologiczny systemów rekomendacji. Cechy pisane przez ludzi muszą być utrzymywane, a ludzie mogą odejść, co prowadzi do utraty wiedzy. Widziałem zbyt wiele firm, w których kluczowa logika cech była zrozumiała tylko przez jedną osobę, a gdy ta osoba odeszła, cały system stał się czarną skrzynką. Model może odkrywać wzory, których ludzie nie potrafią dostrzec. Możesz myśleć, że "czas publikacji" jest ważny, ale model może odkryć, że "trzeci znak to emoji" jest ważniejszy. Zdolność indukcyjna ludzkiego mózgu w obliczu danych na poziomie miliardów to żart. Gdy zachowanie się zmienia, model automatycznie się dostosowuje. Nie trzeba czekać na PM, aby zgłosić wymagania, nie trzeba planować, nie trzeba przeprowadzać testów A/B przez rok. Gdy użytkownicy się zmieniają, model również się zmienia. Jest jeszcze jeden szczegół, na który wiele osób nie zwraca uwagi: jednocześnie przewidują 15 rodzajów zachowań. Polubienia, udostępnienia, odpowiedzi to sygnały pozytywne, ich waga jest dodatnia. Zablokowanie, wyciszenie, zgłoszenie to sygnały negatywne, ich waga jest ujemna. Ostateczny wynik = prawdopodobieństwo pozytywne × dodatnia waga + prawdopodobieństwo negatywne × ujemna waga. Nie chodzi o maksymalizację wskaźnika kliknięć, ale o maksymalizację "nie nienawidzenia użytkownika". To prawdziwa optymalizacja doświadczeń użytkownika, a nie oszukiwanie cię, abyś kliknął, a potem żałował. Kolejny punkt inżynieryjny: Izolacja Kandydatów. Podczas wnioskowania posty nie mogą się wzajemnie widzieć, mogą jedynie widzieć kontekst użytkownika. Korzyścią jest stabilność wyników, można je buforować, nie zmieniają się w zależności od innych postów w tej samej partii. Ta architektura, przywołanie używa podwójnej wieży, precyzyjne sortowanie używa Transformera, filtracja używa reguł, odpowiedzialności są jasno określone. Części wrażliwe na wydajność napisane w Rust, modele w Pythonie, wybór technologii również bardzo pragmatyczny....