Tokenisasi hanyalah kasus khusus dari "chunking" - membangun data tingkat rendah menjadi abstraksi tingkat tinggi - yang pada gilirannya mendasar bagi kecerdasan. Arsitektur baru kami, yang memungkinkan *pemotongan dinamis* hierarkis, tidak hanya bebas tokenizer, tetapi hanya menskalakan lebih baik.
Sukjun (June) Hwang
Sukjun (June) Hwang12 Jul, 00.06
Tokenisasi telah menjadi penghalang terakhir untuk model bahasa yang benar-benar end-to-end. Kami mengembangkan H-Net: jaringan hierarkis yang menggantikan tokenisasi dengan proses chunking dinamis langsung di dalam model, secara otomatis menemukan dan mengoperasikan unit data yang bermakna
Ini adalah proyek yang sangat penting bagi saya - saya sudah ingin menyelesaikannya selama bertahun-tahun, tetapi tidak tahu caranya. Ini semua @sukjun_hwang dan @fluorane pekerjaan yang luar biasa! Saya menulis tentang kisah perkembangannya, dan apa yang mungkin akan terjadi selanjutnya. The H-Net:
194,7K