Acabo de tener el placer de leer un ensayo bastante brillante de @tainab. Hace un punto increíblemente simple (aunque lo envuelve en un poco de teoría social que se puede aceptar o rechazar según la preferencia): hay una forma muy básica en la que se entrenan los modelos de fundación de datos.
sesgado: sobre-muestrean la locuacidad de la misma manera que mirar a las empresas en el S y P 500 hoy crea un sesgo de supervivencia en el análisis técnico retrospectivo o (irónicamente) hay un sesgo antrópico al pensar en mundos posibles. Muestreo basado en tokens v
basado en las respuestas de las personas sobre las muestras, el locuaz.
La mayoría de las personas, la mayor parte del tiempo, generan muy pocos tokens.
1,85K