Avem nevoie de un moment de căutare profundă pentru VLM-uri. Similar cu modul în care GRPO a făcut RL normal și puternic, avem nevoie de același lucru pentru modalitățile unificatoare Da, Qwen-VL-urile sunt foarte bune, dar se pare că doar neîndemânăm. Inovații în micro-design. Doar @vikhyatk are o idee, probabil