إدراج هراء مستخدمي ريديت في بيانات تدريب كل نموذج كبير هو سبب عدم وجود شيء ميؤوس منه إذا كنت تطلب منه أن يشارك في أي شيء مهم مثل أنه شخص بدلا من كتابة الكود أو معالجة البيانات أو دعم العملاء وما إلى ذلك.
Aakash Gupta
Aakash Gupta‏16 مارس، 11:48
50٪ من جميع نصائح العلاقات على ريديت هي "الانسحاب". 15 سنة من البيانات، 52 مليون تعليق، وخط الاتجاه يسير في اتجاه واحد فقط. قام باحث بتصفية r/relationship_advice إلى 1,166,592 تعليقا عالي الجودة وتتبع ما يوصي به الناس فعليا. في عام 2010، كان "نهاية العلاقة" يحصل على حوالي 30٪. بحلول عام 2025، يقترب من 50٪. انخفض برنامج "التواصل" من 22٪ إلى 14٪. انهار "التسوية" من 7٪ إلى 3٪. انخفض "أعط المساحة" من 25٪ إلى 13٪. كل فئة تتطلب الصبر كانت تفقد تقدمها كل عام. الفئة الوحيدة التي تنمو أسرع من "المغادرة" هي "اطلب العلاج"، والتي ارتفعت من 1٪ إلى 6٪. المنتدى الفرعي بدأ يتعلم تدريجيا أن يقول "هذا خارج نطاق راتبي." درب نموذجا على هذه المجموعة من البيانات وسيخبر الناس بالتأكيد بالتفكيك. بيانات التدريب هي 50٪ من "المغادرة" والصعود. النموذج لن يكون مكسورا. سيكون ذلك عكس بدقة ما يعتقده 52 مليون معلق فعليا عن علاقتكما. 50٪ قبل أن تغادر، و14٪ قبل أن تتحدث عن الأمر، و6٪ قبل أنك بحاجة إلى محترف. هذا ليس ذهان ماجستير اللغة الكبيرة. هذا هو الرأي الوسيط للإنسان حول علاقتك، مدعوما بأكبر مجموعة بيانات نصائح تم جمعها على الإطلاق.
القمامة تدخل، تخرج القمامة
‏‎108‏