Je viens de prendre plaisir à lire un essai tout à fait brillant de @tainab. Il fait un point incroyablement simple (bien qu'il l'enveloppe dans un peu de théorie sociale que l'on peut prendre ou laisser selon ses préférences) : il existe une manière très basique dont les modèles de fondation de données sont entraînés.
biaisé : ils suréchantillonnent la loquacité de la même manière que le fait de regarder les entreprises du S et P 500 aujourd'hui crée un biais de survie dans l'analyse technique rétrospective ou (ironiquement) il y a un biais anthropique lorsqu'on pense à des mondes possibles. Échantillonnage basé sur des tokens v
basé sur les réponses des gens sur des échantillons, le loquace.
La plupart des gens, la plupart du temps, génèrent très peu de tokens.
1,85K