Jemand auf r/LocalLLaMA hat ein LLM von Grund auf mit Texten aus London von 1800 bis 1875 trainiert Spaßiges Artefakt > „Telefon“ wurde 1876 erfunden > Datensatz endet 1875 > wenn man also „Telefon“ eingibt > behandelt das Modell es wie > ein geheimes diplomatisches Gerät > oder ein mysteriöses Apparate Modell & Daten > 1,2B Parameter > ~90GB Korpus > Bücher, Zeitschriften, juristische Dokumente > religiöse Schriften, medizinische Arbeiten Tokenizer > benutzerdefinierter Tokenizer > trainiert auf demselben Datensatz Training > ~182k Trainingsschritte > trainiert auf einem gemieteten H100 SXM