Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
public, xAI nu a spus "am antrenat un model de recompensă care mapează > aprecieri așteptate de draft pe tweet."
Dar este foarte evident că au ingredientele brute.
X spune că postările publice, plus metadate precum engagement/repost-uri, pot fi partajate cu xAI pentru antrenament/ajustări fine. de asemenea, spune că interacțiunile, intrările, rezultatele și chiar feedback-ul explicit pe Grok pot fi folosite pentru a îmbunătăți modelele. între timp, Grok are acces nativ la date X în timp real, iar xAI a spus deja că folosește RL la scară largă pentru raționament/utilizarea uneltelor.
Așa că bănuiala mea este că nu este de fapt un mic predictor drăguț > like-uri, ci ceva mai dezordonat și probabil mai puternic, ceea ce se întâmplă când te antrenezi în prealabil pe discursul online, înveți din ce se răspândește, colectezi feedback explicit și implicit, apoi lași metricile de produs să închidă cercul.
Niciun model de recompensă. Mai degrabă un condiționare operantă full-stack.
Limită superioară
Clasament
Favorite
