🙌LLM の任意の世界は、まばらな MoE によって高効率化された強力な 103B-A9B アーチを特徴とする Ming-flash-omni-preview を歓迎します。これは、理解と生成におけるオープンソースのオムニモーダルパフォーマンスの新しいベンチマークを確立します。 1. 制御可能な画像生成: ピクセルレベルの正確な制御を可能にする編集としてのジェネレーティブ セグメンテーションを導入します。このモデルは、GenEvalベンチマークで*0.90*のスコアを達成しました。 2. ストリーミングビデオの理解: 詳細かつシームレスな視聴覚理解のための機能が強化されました。 3. 方言認識: 中国語方言 ASR で SOTA パフォーマンスを達成し、湖南語、広東語、閩南語などの多様な方言の習熟度を実証します。 #OpenSourceModels