Wstępnie wytrenowaliśmy wiele modeli LLM 7B od podstaw i odkryliśmy, że naturalna ekspozycja na dyskurs dotyczący niedopasowania AI powoduje, że modele stają się bardziej niedopasowane. Optymistycznie, odkrywamy również, że dodanie pozytywnych syntetycznych dokumentów w trakcie wstępnego treningu zmniejsza niedopasowanie. Wątek 🧵