🚀 介紹 Qwen3-VL-Embedding 和 Qwen3-VL-Reranker – 推進多模態檢索和跨模態理解的最前沿技術! ✨ 重點: ✅ 基於強大的 Qwen3-VL 基礎模型 ✅ 處理文本、圖像、截圖、視頻和混合模態輸入 ✅ 支持 30 多種語言 ✅ 在多模態檢索基準上達到最先進的性能 ✅ 開源,並可在 Hugging Face、GitHub 和 ModelScope 上獲得 ✅ 即將在阿里雲上提供 API 部署! 🎯 兩階段檢索架構: 📊 嵌入模型 – 在統一的嵌入空間中生成語義豐富的向量表示 🎯 重新排序模型 – 計算細粒度的相關性分數以提高檢索準確性 🔍 主要應用場景: 圖像-文本檢索、視頻搜索、多模態 RAG、視覺問答、多模態內容聚類、多語言視覺搜索等! 🌟 友好的開發者功能: • 可配置的嵌入維度 • 任務特定的指令自定義 • 支持嵌入量化以實現高效且具成本效益的下游部署 Hugging Face: ModelScope: Github: Blog: 技術報告:
Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 架構概述。
MMEB-v2 和 MMTEB 基準的評估結果
108