Difusi untuk segalanya! Kami membagikan resep untuk memulai dari VLM regresif otomatis yang telah dilatih sebelumnya dan, dengan komputasi pelatihan yang sangat sedikit dan beberapa trik anil yang bagus, mengubahnya menjadi VLM difusi SOTA. Penelitian dalam difusi untuk bahasa berkembang sangat cepat dan dalam pikiran saya, memberikan jalan yang menjanjikan untuk modalitas pemersatu seperti model autoregresif 'omni'. Pekerjaan luar biasa yang dipimpin oleh @mariannearr @ServerProcessor selama musim panas.