Włączenie wypocin użytkowników Reddita do danych treningowych każdego LLM jest dużą częścią tego, dlaczego jest to beznadziejne, jeśli naprawdę prosisz go o wyrażenie opinii na jakikolwiek ważny temat, jakby był osobą, zamiast po prostu pisać kod, przetwarzać dane, robić wsparcie klienta itp.
Aakash Gupta
Aakash Gupta16 mar, 11:48
50% wszystkich porad dotyczących związków na Reddit to "odejdź". 15 lat danych, 52 miliony komentarzy, a linia trendu idzie tylko w jednym kierunku. Badacz przefiltrował r/relationship_advice do 1,166,592 jakościowych komentarzy i śledził, co ludzie naprawdę polecają. W 2010 roku "Zakończ związek" wynosiło około 30%. Do 2025 roku zbliża się do 50%. "Komunikacja" spadła z 22% do 14%. "Kompromis" załamał się z 7% do 3%. "Daj przestrzeń" spadło z 25% do 13%. Każda kategoria, która wymaga cierpliwości, co roku traciła na znaczeniu. Jedyną kategorią, która rośnie szybciej niż "odejdź", jest "Szukaj terapii", która wzrosła z 1% do 6%. Subreddit powoli uczy się mówić "to przekracza moje kompetencje". Wytrenuj model na tym zbiorze danych, a z pewnością powie ludziom, aby się rozstali. Dane treningowe to 50% "odejdź" i rośnie. Model nie byłby zepsuty. Dokładnie odzwierciedlałby to, co 52 miliony komentujących naprawdę myślą o twoim związku. 50% wcześniejsza opinia, że powinieneś odejść, 14% wcześniejsza opinia, że powinieneś o tym porozmawiać, i 6% wcześniejsza opinia, że potrzebujesz profesjonalisty. To nie jest psychopatia LLM. To medianowa ludzka opinia na temat twojego związku, poparta największym zbiorem porad kiedykolwiek zebranym.
Śmieci w, śmieci out
83