Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
X otevírá doporučovací algoritmus a nejkrutější je: žádné manuální funkce.
Tradiční doporučovací systém musí vychovat spoustu lidí na psaní feature projektů, co "uživatelský bucket", "author fan quantile", "post popularity attenuation coefficient", změnit feature test na tři měsíce a může se to zrušit, až bude online.
X přímo nechal Grok Transformera učit se end-to-end a zničil tuto sadu.
Proč je to důležité?
Feature engineering je největší technickou zátěží doporučovacího systému. Vlastnosti lidí psané lidmi musí být udržovány, lidé odejdou a znalosti se ztratí. Viděl jsem příliš mnoho firem, kde jen jeden člověk rozumí základní logice funkcí, a ten odejde a celý systém se stane černou skříňkou.
Modely dokážou objevit vzory, na které by lidé nikdy nepomysleli. Myslíte si, že "čas na zveřejnění" je důležitý, a model může zjistit, že "třetí slovo je emoji" je důležitější. Indukční schopnost lidského mozku je vtip tváří v tvář stovkám milionů dat.
Chování se mění a model se automaticky přizpůsobuje. Není třeba čekat, až PM zvýší poptávku, žádné plánování, žádné A/B testování po celý rok. Uživatelé se mění, stejně jako model.
Existuje ještě jeden detail, kterému mnoho lidí nevěnuje pozornost: předpovídají 15 chování najednou.
Lajky, retweety a odpovědi jsou pozitivní signály a váha je pozitivní. Blokování, ztlumení a hlášení jsou negativní signály a váha je záporná.
Konečné skóre = kladná pravděpodobnost × kladná váha + záporná pravděpodobnost × záporná váha
Nejde o maximalizaci míry prokliku, ale o maximalizaci "uživatelé to nemají rádi".
To je skutečná optimalizace uživatelského zážitku, ne klamání a kliknutí a litování toho.
Další inženýrský vrchol: Izolace kandidátů.
Při uvažování vybrané příspěvky se navzájem nevidí, pouze uživatelský kontext. Výhodou je, že skóre je stabilní, lze ho ukládat do mezipaměti a nemění se kvůli dalším příspěvkům ve stejné dávce.
Tato architektura používá dvojčata pro přivolání, transformátor pro jemné uspořádání, pravidla pro filtrování a jasné odpovědnosti.
Rust píše části citlivé na výkon, Python modely a technický výběr je také velmi pragmatický....

Top
Hodnocení
Oblíbené
