Ho appena avuto il piacere di leggere un saggio piuttosto brillante di @tainab. Fa un punto incredibilmente semplice (anche se lo avvolge in un po' di teoria sociale che si può prendere o lasciare a piacere): c'è un modo molto basilare in cui i modelli di fondazione dei dati vengono addestrati.
di parte: sovra campionano la loquacità nello stesso modo in cui guardare le aziende nell'S e P 500 oggi crea un bias di sopravvivenza nell'analisi tecnica retrospettiva o (ironicamente) c'è un bias antropico quando si pensa a mondi possibili. Campionamento basato su token v
basato sulle risposte delle persone su campioni, il loquace.
La maggior parte delle persone, la maggior parte del tempo, genera molto pochi token.
1,86K