DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

public, xAI nu a spus "am antrenat un model de recompensă care mapează > aprecieri așteptate de draft pe tweet." Dar este foarte evident că au ingredientele brute. X spune că postările publice, plus metadate precum engagement/repost-uri, pot fi partajate cu xAI pentru antrenament/ajustări fine. de asemenea, spune că interacțiunile, intrările, rezultatele și chiar feedback-ul explicit pe Grok pot fi folosite pentru a îmbunătăți modelele. între timp, Grok are acces nativ la date X în timp real, iar xAI a spus deja că folosește RL la scară largă pentru raționament/utilizarea uneltelor. Așa că bănuiala mea este că nu este de fapt un mic predictor drăguț > like-uri, ci ceva mai dezordonat și probabil mai puternic, ceea ce se întâmplă când te antrenezi în prealabil pe discursul online, înveți din ce se răspândește, colectezi feedback explicit și implicit, apoi lași metricile de produs să închidă cercul. Niciun model de recompensă. Mai degrabă un condiționare operantă full-stack.

Limită superioară

Clasament

Favorite