自我改进的 VLM 评判者,无需人工注释