🚀 Qwen3-VL-EmbeddingとQwen3-VL-Rerankerを紹介します。マルチモーダル検索とクロスモーダル理解の最先端を前進させています! ✨ ハイライト: ✅ 堅牢なQwen3-VL基盤モデルの上に構築されています ✅ テキスト、画像、スクリーンショット、動画、混合モダリティ入力を処理します ✅ 30+言語に対応しています ✅ マルチモーダル検索ベンチマークで最先端の性能を達成 ✅ オープンソースで、Hugging Face、GitHub、ModelScopeで利用可能です ✅ Alibaba CloudでのAPI展開が間もなく始まります! 🎯 二段階の検索アーキテクチャ: 📊 埋め込みモデル – 統一された埋め込み空間内で意味的に豊かなベクトル表現を生成する 🎯 リランクモデル – 検索精度向上のための細かい関連性スコアを計算します 🔍 主な応用シナリオ: 画像-テキスト検索、動画検索、マルチモーダルRAG、視覚的な質問応答、マルチモーダルコンテンツクラスタリング、多言語視覚検索など、多機能です! 🌟 開発者に優しい機能: ・設定可能な埋め込み寸法 ・タスク固有の指示カスタマイズ • 効率的かつコスト効率の高い下流展開のための量子化サポートの組み込み ハグフェイス: モデルスコープ: GitHub: ブログ: テックレポート:
Qwen3-VL-EmbeddingおよびQwen3-VL-Rerankerアーキテクチャの概要。
MMEB-v2およびMMTEBベンチマークの評価結果
159