SimpleSeg: Nhận thức pixel cấp độ gốc cho MLLMs; - định hình lại phân đoạn như một chuỗi đơn giản các tọa độ văn bản; - khớp với các thuật toán phân đoạn SOTA phức tạp. - Kiến trúc kiểu LLaVA; - SimpleSeg-Kimi-VL & SimpleSeg-Qwen2.5-VL