Właśnie miałem przyjemność przeczytać całkiem genialny esej autorstwa @tainab. Zawiera on niezwykle prostą tezę (choć opakowaną w trochę teorii społecznej, którą można przyjąć lub odrzucić według własnych preferencji): istnieje jeden bardzo podstawowy sposób, w jaki modele oparte na danych są trenowane.
stronniczy: nadpróbkują loquacity w ten sam sposób, w jaki patrzenie na firmy w S&P 500 dzisiaj tworzy bias przetrwania w retrospektywnej analizie technicznej lub (ironicznie) istnieje bias antropiczny, gdy myślimy o możliwych światach. Próbkowanie oparte na tokenach v
na podstawie odpowiedzi ludzi na próbki, gadatliwy.
Większość ludzi przez większość czasu generuje bardzo mało tokenów.
1,86K