トークン化は、低レベルのデータを高レベルの抽象化に組み込む「チャンク化」の特殊なケースにすぎず、これはインテリジェンスの基本です。 階層的な*動的チャンキング*を可能にする新しいアーキテクチャは、トークナイザーを使用しないだけでなく、単にスケーラビリティが向上しています。
Sukjun (June) Hwang
Sukjun (June) Hwang7月12日 00:06
トークン化は、真にエンドツーエンドの言語モデルに対する最後の障壁でした。 私たちは、トークン化をモデル内で直接動的なチャンキングプロセスに置き換える階層型ネットワークであるH-Netを開発しました。これは、意味のあるデータ単位を自動的に検出して操作する階層型ネットワークです
これは私にとって非常に重要なプロジェクトでした - 何年もの間それを解決したいと思っていましたが、どうすればいいのかわかりませんでした。これはすべて@sukjun_hwangであり、@fluoraneの素晴らしい仕事でした! その開発の話と、次に来るかもしれないことについて書きました。 H-Netは、
194.7K