Дифузія для всього! Ми ділимося рецептом, щоб почати з попередньо навченого авторегресійного VLM і, з дуже невеликими навчальними обчисленнями та деякими приємними трюками відпалу, перетворити його на дифузійний VLM SOTA. Дослідження в області дифузії для мови просуваються дуже швидко і, на мою думку, дають такий же перспективний шлях об'єднуючих модальностей, як і «всеосяжні» авторегресійні моделі. Дивовижна робота під керівництвом @mariannearr @ServerProcessor протягом літа.