Các trọng tài VLM tự cải thiện mà không cần chú thích của con người