Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
kamuoyunda, xAI "tweet taslağını haritalayan bir ödül modeli eğittik, > beklenen beğenmeleri" demedi.
Ama çok açık ki hammaddeleri var.
X, halka açık gönderilerin, ayrıca etkileşim/yeniden paylaşımlar gibi meta verilerin, eğitim veya ince ayar için xAI ile paylaşılabileceğini söylüyor. Ayrıca etkileşimlerinizin, girdilerin, sonuçların ve hatta Grok hakkındaki açık geri bildirimlerinin modelleri geliştirmek için kullanılabileceğini söylüyor. bu arada Grok gerçek zamanlı X verilerine yerel erişime sahip ve xAI zaten akıl yürütme/araç kullanımı için büyük ölçekli RL kullandığını söylemişti.
Yani tahminim, aslında bu sevimli bir tweet > beğeni tahmini değil, daha karmaşık ve muhtemelen daha güçlü bir şey; ki bu çevrimiçi söyleme önceden hazırlandığında, yayılanlardan öğrendiğinizde, açık ve örtük geri bildirimleri topladığınızda ve ürün metriklerinin döngüyü kapatmasına izin verdiğinizde oluyor.
Tek bir ödül modeli yok. daha çok tam stack operant koşullandırma gibi.
En İyiler
Sıralama
Takip Listesi
