自我改進的 VLM 評判者無需人類註釋