Her şey için difüzyon! Önceden eğitilmiş bir otoregresif VLM'den başlamak ve çok az eğitim hesaplaması ve bazı güzel tavlama hileleri ile onu bir SOTA difüzyon VLM'sine dönüştürmek için bir tarif paylaşıyoruz. Dil için yayılma araştırmaları çok hızlı ilerliyor ve bana göre, 'omni' otoregresif modeller kadar birleştirici modaliteler için umut verici bir yol sağlıyor. Yaz boyunca @mariannearr @ServerProcessor liderliğindeki harika çalışma.