Seseorang di r/LocalLLaMA melatih LLM dari awal pada teks London dari tahun 1800 hingga 1875 Artefak yang menyenangkan > "telepon" ditemukan pada tahun 1876 > kumpulan data berhenti pada 1875 > begitu ketika Anda meminta "telepon" > model memperlakukannya seperti > beberapa perangkat diplomatik rahasia > atau peralatan misterius Model & Data > Parameter 1.2B > ~90GB korpus > buku, jurnal, dokumen hukum > tulisan agama, makalah medis Tokenizer > tokenizer kustom > dilatih pada himpunan data yang sama Pelatihan > ~ 182 ribu langkah pelatihan > dilatih dengan H100 SXM sewaan