X otevírá doporučovací algoritmus a nejkrutější je: žádné manuální funkce. Tradiční doporučovací systém musí vychovat spoustu lidí na psaní feature projektů, co "uživatelský bucket", "author fan quantile", "post popularity attenuation coefficient", změnit feature test na tři měsíce a může se to zrušit, až bude online. X přímo nechal Grok Transformera učit se end-to-end a zničil tuto sadu. Proč je to důležité? Feature engineering je největší technickou zátěží doporučovacího systému. Vlastnosti lidí psané lidmi musí být udržovány, lidé odejdou a znalosti se ztratí. Viděl jsem příliš mnoho firem, kde jen jeden člověk rozumí základní logice funkcí, a ten odejde a celý systém se stane černou skříňkou. Modely dokážou objevit vzory, na které by lidé nikdy nepomysleli. Myslíte si, že "čas na zveřejnění" je důležitý, a model může zjistit, že "třetí slovo je emoji" je důležitější. Indukční schopnost lidského mozku je vtip tváří v tvář stovkám milionů dat. Chování se mění a model se automaticky přizpůsobuje. Není třeba čekat, až PM zvýší poptávku, žádné plánování, žádné A/B testování po celý rok. Uživatelé se mění, stejně jako model. Existuje ještě jeden detail, kterému mnoho lidí nevěnuje pozornost: předpovídají 15 chování najednou. Lajky, retweety a odpovědi jsou pozitivní signály a váha je pozitivní. Blokování, ztlumení a hlášení jsou negativní signály a váha je záporná. Konečné skóre = kladná pravděpodobnost × kladná váha + záporná pravděpodobnost × záporná váha Nejde o maximalizaci míry prokliku, ale o maximalizaci "uživatelé to nemají rádi". To je skutečná optimalizace uživatelského zážitku, ne klamání a kliknutí a litování toho. Další inženýrský vrchol: Izolace kandidátů. Při uvažování vybrané příspěvky se navzájem nevidí, pouze uživatelský kontext. Výhodou je, že skóre je stabilní, lze ho ukládat do mezipaměti a nemění se kvůli dalším příspěvkům ve stejné dávce. Tato architektura používá dvojčata pro přivolání, transformátor pro jemné uspořádání, pravidla pro filtrování a jasné odpovědnosti. Rust píše části citlivé na výkon, Python modely a technický výběr je také velmi pragmatický....