🚀 Qwen3-VL-Embedding ve Qwen3-VL-Reranker ile tanışıyoruz – multimodal arama ve çapraz modal anlayışta en son teknolojiyi geliştiriyoruz! ✨ Öne Çıkanlar: ✅ Sağlam Qwen3-VL temel modeli üzerine inşa edilmiştir ✅ Metin, görseller, ekran görüntüleri, videolar ve karışık modalite girdilerini işler ✅ 30+ dili destekler ✅ Çok modlu geri alma kıyaslamalarında son teknoloji performansı elde eder ✅ Açık kaynak ve Hugging Face, GitHub ve ModelScope'ta mevcut ✅ Alibaba Cloud'da API dağıtımı yakında geliyor! 🎯 İki aşamalı geri alma mimarisi: 📊 Gömü Modeli – birleşik bir gömüleme alanında anlamsal olarak zengin vektör temsilleri üretir 🎯 Reranker Modeli – gelişmiş arama doğruluğu için ince tanenli alaka puanlarını hesaplar 🔍 Temel uygulama senaryoları: Görsel-metin buluşma, video arama, çok modlu RAG, görsel soru yanıtlama, çok modlu içerik kümelendirme, çok dilli görsel arama ve daha fazlası! 🌟 Geliştirici dostu yetenekler: • Yapılandırılabilir göme boyutları • Göreve özgü komut özelleştirmesi • Verimli ve maliyet etkin bir sonraki dağıtım için kuantlaşma desteğinin gömülmesi Sarılma Yüz: ModelScope: Github: Blog: Teknik Rapor:
Qwen3-VL-Embedding ve Qwen3-VL-Reranker mimarisinin genel görünümü.
MMEB-v2 ve MMTEB benchmarkları üzerindeki değerlendirme sonuçları
124